如何快速入门大模型编程实践?2026年上海交大AI安全课程指南
AI Summary (BLUF)
This tutorial series, derived from Shanghai Jiao Tong University's 2024 AI Security Technology course, provides hands-on programming guidance for large language models, covering fine-tuning, deployment, prompt engineering, knowledge editing, model watermarking, jailbreak attacks, multimodal models, and AI agent security.
原文翻译: 本教程系列源自上海交通大学2024年春季《人工智能安全技术》课程讲义,提供大模型相关的动手编程指导,涵盖微调与部署、提示学习与思维链、知识编辑、模型水印、越狱攻击、多模态模型、大模型智能体与安全等内容。
引言
《动手学大模型指参数规模巨大、能力强大的人工智能基础模型,如GPT、Gemini等,能处理文本、多模态及空间数据。》系列编程实践教程,由上海交通大学2024年春季《人工智能安全技术》课程(NIS3353)讲义拓展而来(教师:张倬胜),旨在提供大模型指参数规模巨大、能力强大的人工智能基础模型,如GPT、Gemini等,能处理文本、多模态及空间数据。相关的入门编程参考。
The Hands-on Large Language Models series of programming practice tutorials is an extension of the lecture notes from the Spring 2024 Artificial Intelligence Security Technology course (NIS3353) at Shanghai Jiao Tong University (Instructor: Zhuosheng Zhang). It aims to provide introductory programming references related to large language models.
通过简单实践,帮助同学快速入门大模型指参数规模巨大、能力强大的人工智能基础模型,如GPT、Gemini等,能处理文本、多模态及空间数据。,更好地开展课程设计或学术研究。涵盖微调在预训练模型基础上,使用特定领域数据进一步训练,以适应具体任务需求的技术过程。与部署、提示学习通过设计特定的输入提示来引导大模型生成期望输出的技术,包括思维链等高级提示方法。与思维链、知识编辑对大模型内部知识进行修改或更新的技术,用于修正错误知识或添加新知识。、模型水印在模型中嵌入特定标识的技术,用于模型版权保护、溯源和防伪。、越狱攻击针对LLM安全护栏的绕过技术,攻击者通过特定提示词技巧突破模型的安全限制,使其生成原本被禁止的内容。、多模态模型An AI model capable of processing and generating multiple types of data such as text, images, and audio.、大模型智能体基于大模型构建的智能代理系统,能够自主执行任务、与环境交互并做出决策。与安全等内容。
Through hands-on practice, it helps students quickly get started with large language models, enabling them to better conduct course projects or academic research. It covers topics such as fine-tuning and deployment, prompt learning and chain-of-thought, knowledge editing, model watermarking, jailbreak attacks, multimodal models, large model agents, and security.
项目概览与获取
本教程的所有代码、示例及文档均已开源,方便学习者直接使用与参考。
All code, examples, and documentation for this tutorial are open-sourced, facilitating direct use and reference by learners.
项目地址:https://github.com/Lordog/dive-into-llms.
Project Repository: https://github.com/Lordog/dive-into-llms.
常见问题(FAQ)
这个教程系列具体包含哪些大模型指参数规模巨大、能力强大的人工智能基础模型,如GPT、Gemini等,能处理文本、多模态及空间数据。实践内容?
教程涵盖微调在预训练模型基础上,使用特定领域数据进一步训练,以适应具体任务需求的技术过程。与部署、提示学习通过设计特定的输入提示来引导大模型生成期望输出的技术,包括思维链等高级提示方法。与思维链、知识编辑对大模型内部知识进行修改或更新的技术,用于修正错误知识或添加新知识。、模型水印在模型中嵌入特定标识的技术,用于模型版权保护、溯源和防伪。、越狱攻击针对LLM安全护栏的绕过技术,攻击者通过特定提示词技巧突破模型的安全限制,使其生成原本被禁止的内容。、多模态模型An AI model capable of processing and generating multiple types of data such as text, images, and audio.、大模型智能体基于大模型构建的智能代理系统,能够自主执行任务、与环境交互并做出决策。与安全等核心实践主题。
如何获取《动手学大模型指参数规模巨大、能力强大的人工智能基础模型,如GPT、Gemini等,能处理文本、多模态及空间数据。》的代码和文档?
所有代码、示例及文档均已开源,项目地址为 https://github.com/Lordog/dive-into-llms,学习者可直接使用与参考。
这个教程系列适合什么背景的学习者?
教程旨在通过简单实践帮助学习者快速入门大模型指参数规模巨大、能力强大的人工智能基础模型,如GPT、Gemini等,能处理文本、多模态及空间数据。,适合开展课程设计或学术研究,源自上海交大2024年AI安全技术课程。
版权与免责声明:本文仅用于信息分享与交流,不构成任何形式的法律、投资、医疗或其他专业建议,也不构成对任何结果的承诺或保证。
文中提及的商标、品牌、Logo、产品名称及相关图片/素材,其权利归各自合法权利人所有。本站内容可能基于公开资料整理,亦可能使用 AI 辅助生成或润色;我们尽力确保准确与合规,但不保证完整性、时效性与适用性,请读者自行甄别并以官方信息为准。
若本文内容或素材涉嫌侵权、隐私不当或存在错误,请相关权利人/当事人联系本站,我们将及时核实并采取删除、修正或下架等处理措施。 也请勿在评论或联系信息中提交身份证号、手机号、住址等个人敏感信息。