
上周在 GitHub 刷 Timeline,一个仓库的描述把我钩住了:
Learn it. Build it. Ship it for others.
简单,直接,有点拽。点进去一看,14k star,430 多个课程,320 小时的学习内容,Python、TypeScript、Rust、Julia 四门语言。
我本能想划走。又是那种"从入门到放弃"的大而全教程?但翻了源码结构之后,我改主意了。
不教 API 调用,教你怎么造 API
现在市面上大部分 AI 教程都在教调 API。“五分钟搭建你的第一个 GPT 应用”,“用 LangChain 快速开发 Agent”——有用吗?有点。但总觉得差点东西。
调用 API 和理解 API 之间隔着一条沟。
ai-engineering-from-scratch 的作者也这么想。它的课程设计思路很直接:
你不先手写一遍反向传播,就别急着用 PyTorch。
20 个阶段,从数学基础开始,到多智能体结束。中间每一层都要自己造轮子:
• Phase 1:手推梯度下降,手写矩阵运算 • Phase 3:从零实现多层感知机和反向传播 • Phase 7:自己搭 Transformer,搞清楚 attention 到底在算什么 • Phase 10:手写一个 mini LLM • Phase 14:自己实现 Agent 循环
等 PyTorch 出场的时候,你已经知道它底层在干什么了。
一个课程的结构
翻目录结构,发现一个有意思的设计:
phases/<NN>-<phase-name>/<NN>-<lesson-name>/├── code/ # 四种语言的实现├── docs/│ └── en.md # 课程讲解└── outputs/ # 这节课产出的工具每个课程都走六个步骤:
MOTTO → PROBLEM → CONCEPT → BUILD IT → USE IT → SHIP IT后面三个是关键。
BUILD IT:用最原始的数学实现,不依赖任何框架。Phase 14 的 Agent 循环,核心代码 120 行纯 Python,没有依赖库。
USE IT:再用 PyTorch 或生产级库实现一遍,对比差异。
SHIP IT:每个课程都要产出一个可复用的东西:
• 一个 prompt 模板 • 一个 Claude/Cursor skill • 一个 MCP server
学完就有产出,不是又看完一个教程。
真正打动我的细节
翻了几课的源码,发现几个有意思的设计:
1. 代码不只是示例
很多教程的代码是"示意代码",缺少边界处理、没有测试。这个项目的每个 code/ 目录都是完整的、带单元测试的实现。
# phases/14-agent-engineering/01-agent-loop/code/agent_loop.pydefrun(query, tools): history = [user(query)]for step inrange(MAX_STEPS): msg = llm(history)if msg.tool_calls:for call in msg.tool_calls: result = tools[call.name](**call.args) history.append(tool_result(call.id, result))continuereturn msg.contentraise StepLimitExceeded简洁但完整。有最大步数限制,有工具调用循环,有清晰的退出条件。
2. 产出物有实际价值
统计了一下 outputs/ 目录:378 个可安装的 skills,99 个 prompt 模板,435 个代码文件。
这不是课后作业,是能塞进日常工作流的工具。
3. 多语言不是噱头
Python 之外的实现不是为了凑数。Phase 10 的 LLM 实现对比:
• Python 版本教学友好,注释详细 • Rust 版本性能导向,展示内存安全设计 • Julia 版本科学计算风格,向量化操作
对比看不同语言的实现,对"为什么这样写"会有更深的体感。
谁适合这个项目?
说实话,不适合所有人。
纯新手想快速上手 AI 开发,这项目可能会劝退。它默认你已经会写代码,有耐心啃数学推导。
但如果你:
• 已经在用 AI API,但想知道底层发生了什么 • 想从调包侠进化到能读论文、能改源码 • 有耐心,能接受先造轮子再用车
那这个项目值得花时间。
结尾
翻了两天这个仓库,我的感受是:好的开源项目不只是代码集合,它有清晰的教学思路和设计审美。
从目录结构到代码风格,从课程顺序到产出物设计,都能看出作者在想什么、为什么这样做。
项目地址:https://github.com/rohitg00/ai-engineering-from-scratch
想深入学习 AI 工程的,建议从 Phase 1 的数学基础开始。时间有限的话,可以直接跳到 Phase 14 的 Agent Engineering,这是目前最火的领域,这个课程会带你从零实现一个 Agent 循环。
夜雨聆风