机器学习 / 深度学习 / LLM 后训练 / 现代组件

从梯度下降到 GPT

给会写 Python、想快速建立大语言模型训练直觉的读者:用 23 章中文教程和 PyTorch 实验,把损失函数、反向传播、CNN、RNN、Attention、 Transformer、GPT、SFT、PPO、DPO、GRPO、现代 LLM 组件、多模态和 Diffusion 串成一条能跑起来的学习路径。

学习主线

这套专栏只保留通往 LLM 的必要地基

前半段不做机器学习百科,而是围绕“数据进入模型,损失衡量错误,梯度更新参数” 这条主线反复强化。后半段把注意力机制、Transformer、GPT 训练目标和偏好优化放到同一张图里理解。

数据 x / y / token
前向传播 CNN / RNN / GPT
损失函数 CE / mask / preference
参数更新 SGD / Adam / policy
01

概念必须落到代码

每章都配一个 PyTorch 脚本或可检查的小实验,避免只停留在名词解释。

02

老知识只讲必要部分

CNN、RNN、LSTM、GRU 作为建立直觉的台阶,重点最终回到 Transformer 与 LLM。

03

训练目标保持连贯

从分类交叉熵到 next-token loss,再到 response-only mask、preference loss 和 policy objective。

章节目录

23 章路线

跑通实验

文章和代码是一一对应的

本专栏的第一目标是让读者把核心训练循环跑通。项目使用 uv 管理环境, smoke test 会覆盖从手写梯度到 mini-GPT 生成的关键闭环。

uv sync --locked
bash scripts/smoke_test.sh

uv run python -m llm_tutor.experiments.train_cnn --epochs 2
uv run python -m llm_tutor.experiments.inspect_self_attention
uv run python -m llm_tutor.experiments.train_mini_gpt --epochs 2
uv run python -m llm_tutor.experiments.run_capstone_pipeline

代码入口

核心代码入口

参考风格

参考的知识分享站点气质