mobile wallpaper 1mobile wallpaper 2mobile wallpaper 3mobile wallpaper 4
1103 字
3 分钟
机器学习与大语言模型学习路线
2025-02-16

系列简介#

这是一套系统性学习机器学习与大语言模型的完整教程体系。

从 2017 年 Transformer 论文发表,到 2022 年 ChatGPT 横空出世,再到 2025 年 DeepSeek R1 开源推理模型,AI 领域经历了前所未有的技术爆发。本系列紧跟技术前沿,帮助读者建立完整的知识体系。

系列规模:90+ 篇原创文章,持续更新中。

学习路线总览#

flowchart TB subgraph 入门["入门阶段"] ML101["机器学习实战入门"] LLMGuide["从零理解大语言模型"] end subgraph 进阶["进阶阶段"] Agent["AI Agent 实战指南"] Paper["LLM 论文发展史"] end subgraph 专题["专题深入"] Security["LLM 安全漏洞发展史"] MLSys["ML 系统设计"] end ML101 --> LLMGuide LLMGuide --> Agent LLMGuide --> Paper Agent --> Security Paper --> MLSys style 入门 fill:#e1f5fe style 进阶 fill:#fff3e0 style 专题深入 fill:#f3e5f5

四大子系列#

0.1 从零理解大语言模型#

定位:零基础入门 · 开发者友好

内容:面向开发工程师的大语言模型系统入门课程。从 AI 历史讲起,覆盖 Token 原理、模型选型、Prompt 工程、RAG、Function Calling、Agent、微调等核心技能。

适合人群

  • 想了解 LLM 原理的开发者
  • 需要在工作中应用 AI 的工程师
  • 对 AI 技术感兴趣的技术管理者

文章数量:11 篇

阅读入口从零理解大语言模型


0.2 AI Agent 实战指南#

定位:实战导向 · 工程深入

内容:从基础概念到项目实战,深入讲解 Agent 的规划架构、记忆系统、工具调用、多智能体协作。紧跟前沿进展,涵盖 Kimi 注意力残差、OpenAI o 系列、DeepSeek R1 等最新技术。

适合人群

  • 想构建 AI Agent 应用的开发者
  • 需要设计智能体系统的架构师
  • 关注 AI 前沿技术的研究者

文章数量:20 篇

阅读入口AI Agent 实战指南


0.3 LLM 论文发展史#

定位:历史视角 · 深度解读

内容:按时间线系统梳理 LLM 发展的关键论文。从 2017 年 Transformer 到 2026 年 Attention Residuals,深入解读每篇论文的核心贡献与技术影响。

适合人群

  • 想深入理解 LLM 技术演进的学习者
  • 需要技术选型依据的决策者
  • 准备面试 AI 岗位的求职者

文章数量:60 篇

阅读入口LLM 论文发展史


0.4 LLM 安全漏洞发展史#

定位:安全专题 · 攻防实战

内容:从 2022 年 DAN 越狱攻击到 2025 年 AI 驱动自动化攻击,系统梳理 LLM 安全领域的关键漏洞。帮助读者理解攻击原理、危害程度与防御策略。

适合人群

  • 关注 AI 安全的开发者
  • 负责系统安全的工程师
  • 想了解 LLM 风险的技术管理者

文章数量:7 篇

阅读入口LLM 安全漏洞发展史


独立文章#

文章状态简介
机器学习实战入门已发布ML 应用场景与经典实践项目导览
机器学习系统设计已发布特征工程、模型训练、服务化与 MLOps

推荐学习路径#

0.5 路径一:零基础入门#

第1步:机器学习实战入门(了解 ML 是什么)
第2步:从零理解大语言模型(系统学习 LLM)
第3步:选择感兴趣的方向深入

0.6 路径二:开发者进阶#

第1步:从零理解大语言模型(快速入门)
第2步:AI Agent 实战指南(动手实践)
第3步:构建自己的 AI 应用

0.7 路径三:深度研究#

第1步:LLM 论文发展史(理解技术演进)
第2步:AI Agent 实战指南(掌握前沿应用)
第3步:LLM 安全漏洞发展史(全面视角)

0.8 路径四:架构师视角#

第1步:从零理解大语言模型(建立认知)
第2步:机器学习系统设计(系统架构)
第3步:LLM 安全漏洞发展史(安全视角)

技术图谱#

mindmap root((AI 技术栈)) 基础理论 Transformer 架构 预训练范式 RLHF 对齐 核心能力 Prompt Engineering RAG 知识增强 Function Calling Agent 架构 效率优化 LoRA 微调 Flash Attention 量化部署 Speculative Decoding 前沿进展 推理模型 o1/R1 多模态 Gemini 架构创新 AttnRes 工程实践 ML 系统设计 安全防御 可观测性 成本优化

外部资源#

0.9 官方文档#

0.10 经典论文#

0.11 学习资源#

0.12 开源项目#

更新日志#

  • 2026-03:新增 LLM 安全漏洞发展史系列
  • 2026-02:新增 DeepSeek R1、Claude 4、Gemini 2 等前沿内容
  • 2025-12:AI Agent 实战指南扩充至 20 篇
  • 2025-09:LLM 论文发展史系列启动
  • 2025-06:从零理解大语言模型系列完成

本系列持续更新,如有问题或建议,欢迎提交 Issue。


参考#

支持与分享

如果这篇文章对你有帮助,欢迎支持作者或分享给更多人

机器学习与大语言模型学习路线
https://blog.souloss.com/posts/machine-learning/machine-learning-series-guide/
作者
Souloss
发布于
2025-02-16
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时