系列简介
这是一套系统性学习机器学习与大语言模型的完整教程体系。
从 2017 年 Transformer 论文发表,到 2022 年 ChatGPT 横空出世,再到 2025 年 DeepSeek R1 开源推理模型,AI 领域经历了前所未有的技术爆发。本系列紧跟技术前沿,帮助读者建立完整的知识体系。
系列规模:90+ 篇原创文章,持续更新中。
学习路线总览
四大子系列
0.1 从零理解大语言模型
定位:零基础入门 · 开发者友好
内容:面向开发工程师的大语言模型系统入门课程。从 AI 历史讲起,覆盖 Token 原理、模型选型、Prompt 工程、RAG、Function Calling、Agent、微调等核心技能。
适合人群:
- 想了解 LLM 原理的开发者
- 需要在工作中应用 AI 的工程师
- 对 AI 技术感兴趣的技术管理者
文章数量:11 篇
阅读入口:从零理解大语言模型
0.2 AI Agent 实战指南
定位:实战导向 · 工程深入
内容:从基础概念到项目实战,深入讲解 Agent 的规划架构、记忆系统、工具调用、多智能体协作。紧跟前沿进展,涵盖 Kimi 注意力残差、OpenAI o 系列、DeepSeek R1 等最新技术。
适合人群:
- 想构建 AI Agent 应用的开发者
- 需要设计智能体系统的架构师
- 关注 AI 前沿技术的研究者
文章数量:20 篇
阅读入口:AI Agent 实战指南
0.3 LLM 论文发展史
定位:历史视角 · 深度解读
内容:按时间线系统梳理 LLM 发展的关键论文。从 2017 年 Transformer 到 2026 年 Attention Residuals,深入解读每篇论文的核心贡献与技术影响。
适合人群:
- 想深入理解 LLM 技术演进的学习者
- 需要技术选型依据的决策者
- 准备面试 AI 岗位的求职者
文章数量:60 篇
阅读入口:LLM 论文发展史
0.4 LLM 安全漏洞发展史
定位:安全专题 · 攻防实战
内容:从 2022 年 DAN 越狱攻击到 2025 年 AI 驱动自动化攻击,系统梳理 LLM 安全领域的关键漏洞。帮助读者理解攻击原理、危害程度与防御策略。
适合人群:
- 关注 AI 安全的开发者
- 负责系统安全的工程师
- 想了解 LLM 风险的技术管理者
文章数量:7 篇
阅读入口:LLM 安全漏洞发展史
独立文章
推荐学习路径
0.5 路径一:零基础入门
第1步:机器学习实战入门(了解 ML 是什么)第2步:从零理解大语言模型(系统学习 LLM)第3步:选择感兴趣的方向深入0.6 路径二:开发者进阶
第1步:从零理解大语言模型(快速入门)第2步:AI Agent 实战指南(动手实践)第3步:构建自己的 AI 应用0.7 路径三:深度研究
第1步:LLM 论文发展史(理解技术演进)第2步:AI Agent 实战指南(掌握前沿应用)第3步:LLM 安全漏洞发展史(全面视角)0.8 路径四:架构师视角
第1步:从零理解大语言模型(建立认知)第2步:机器学习系统设计(系统架构)第3步:LLM 安全漏洞发展史(安全视角)技术图谱
外部资源
0.9 官方文档
0.10 经典论文
- Attention Is All You Need - Transformer 开山之作
- GPT-3 - Few-Shot Learning 里程碑
- InstructGPT - RLHF 训练方法
- Chain of Thought - 推理能力突破
- DeepSeek R1 - 开源推理模型
0.11 学习资源
- Jay Alammar: The Illustrated Transformer - 可视化讲解 Transformer
- Lil’Log: Attention? Attention! - 注意力机制详解
- Stanford CS224N - NLP 课程
- Fast.ai - 实践导向的 ML 课程
0.12 开源项目
- LangChain - LLM 应用开发框架
- AutoGen - 微软多 Agent 框架
- LlamaIndex - RAG 数据框架
- Hugging Face Transformers - 模型库
更新日志
- 2026-03:新增 LLM 安全漏洞发展史系列
- 2026-02:新增 DeepSeek R1、Claude 4、Gemini 2 等前沿内容
- 2025-12:AI Agent 实战指南扩充至 20 篇
- 2025-09:LLM 论文发展史系列启动
- 2025-06:从零理解大语言模型系列完成
本系列持续更新,如有问题或建议,欢迎提交 Issue。
参考
- OpenAI API 文档
- Anthropic Claude 文档
- Google Gemini 文档
- LangChain 文档
- Hugging Face 文档
- Attention Is All You Need
- GPT-3
- InstructGPT
- Chain of Thought
- DeepSeek R1
- Jay Alammar: The Illustrated Transformer
- Lil’Log: Attention? Attention!
- Stanford CS224N
- Fast.ai
- LangChain
- AutoGen
- LlamaIndex
- Hugging Face Transformers
支持与分享
如果这篇文章对你有帮助,欢迎支持作者或分享给更多人
部分信息可能已经过时






