MIT学霸的AI学习法:我把框架拆成了可照抄的清单

先问一个问题

你学一门新技术，一般是什么流程？

多数人的答案是：找教程 → 看视频 → 调 Demo → 收藏 → 结束。

这个流程有个致命问题：你一直在被动接收信息，从来没有主动建构过知识。

结果就是：教程看了一堆，真正要用的时候脑子一片空白。术语都认识，拼在一起就不懂了。

今天分享的方法，核心只有一句话：

不是学完再动手，而是以用促学、以测促懂。

一、为什么你看了很多教程还是不会用

知识分成三种层次：

层次	表现	你能做什么
知道	看过、听过、有印象	能复读、能认出来
会用	知道在什么场景用、怎么用	能完成特定任务
理解	能从零推导、能向别人解释	能迁移到新场景

看教程、刷视频，只能让你达到"知道"这个层次。

想从"知道"跨到"会用"甚至"理解"，靠的是主动提问 + 刻意测试 + 反复修正——而不是被动输入。

二、六步学习法，完整清单照抄

下面这套方法，我从 MIT 学霸的 AI 学习框架改造而来，本人实际用于 LangChain、LlamaIndex 的学习。

Step1：资料准备——围绕"做一件事"来组织

原则：宁精勿滥。不是"学一个领域"，而是"能做一件具体的事"。

资料优先级：

优先级	类型	说明
P0	官方文档 + 快速跑通的 Demo	最权威，能验证可行性
P1	官方教程 / Quickstart	系统性了解全貌
P2	优质博客 / 实战案例	补充经验和踩坑记录
P3	论文 / 深度文章	理解底层原理

实操清单：

找到官方 Quickstart，完整跑通
把核心文档读一遍，划出"看不懂"的地方
建一个文件夹，专门放这个项目的学习资料
给每份资料标注难度等级（P0/P1/P2）

step2：提出核心问题——先问再学，带着问题去找答案

在打开任何教程之前，先逼自己用一句话回答这四个问题：

① 这个工具解决什么核心问题？

不是背定义，是用自己的话说："它能让我在什么场景下不用写那么多代码"。

② 这个工具的核心思维模式是什么？

比如 LangChain 的核心是"把 LLM 调用封装成可组合的 Chain"；LlamaIndex 的核心是"把文档组织成可高效检索的索引"。能说清楚这个，比会调 API 重要十倍。

③ 这个工具的争议点和局限在哪里？

去 GitHub Issues 或 Reddit 上搜一圈，看看用户在抱怨什么。知道它"不能做什么"，比知道"能做什么"更值钱。

④ 我能出 10 道题检验自己是否真的理解了吗？

这步最关键——10 道题里要有：

5 道概念理解题（不是背定义，是考理解）
3 道应用判断题（什么场景用 / 不用这个工具）
2 道边界情况题（什么条件下它会出问题）

step3：搭建思维框架——让 AI 帮你提炼

把收集的资料（或者链接）丢给 AI，让它帮你提炼：

Prompt 模板：
"请帮我梳理 [框架名] 的核心概念体系，用结构化方式表达，重点说明各模块之间的关系，用中文回答。"

得到框架后，自己再动手画一遍：

Step4：明确争议点和边界——知道"不能做什么"更重要

重点厘清三件事：

1. 它和同类框架的核心差异是什么？

用 AI 生成对比表："请对比 LangChain 和 LlamaIndex 在 RAG 数据检索这个场景上的设计差异"

2. 什么场景下它的性能会下降或失效？

LangChain：大项目时 Chain 调试困难；LlamaIndex：过于专注数据索引，应用编排能力弱。

3. 社区公认的痛点是什么？

去 GitHub Stars > Issues > discussions 翻一圈，比读十篇博客有用。

Step5：测试与反馈——答错比答对更重要

这是整个方法论最核心的一步。

流程：

用第二步生成的 10 道题做自测
每道题必须给出判断依据，不能只写答案
答错的题 → 定位漏洞来源（哪个概念理解错了？）
针对漏洞追问 AI："我在 [具体问题] 上答错了，你能帮我分析我哪里理解错了吗？"
修正理解，重新做一遍同类型题目

自测质量标准：

好的测试题，能区分"知道名字"和"理解原理"：

❌ "LangChain 是什么"
✅ "LangChain 的 LCEL 解决了什么问题？它和传统 Chain 有什么不同？"
❌ "LlamaIndex 是做检索的吗"
✅ "在什么场景下我应该优先选 LlamaIndex 而不是 LangChain？"

Step6：知识内化——从零能搭出来，才算学会

合上资料，从零开始，能独立搭建完整流程，才算内化。

内化三层次：

层次	标准	说明
第一层	能跑通 Demo	知道"怎么做"
第二层	能独立搭建完整项目	理解"为什么这样做"
第三层	能向别人解释原理	达到"教就是学"

每次学习完成后必做：

整理踩坑记录（what/why/how）
写一份代码片段注释版（这份代码为什么要这么写）
把框架图手绘一遍，存到笔记里
更新自己的知识库索引

三、LangChain 和 LlamaIndex 各学多久、怎么学

作为方法论的实际案例，附上两个框架的学习路径：

LangChain 优先学这些：

1.Model I/O（Prompt Template / Chat Model / Output Parser）

2.LCEL（LangChain Expression Language）——理解它就理解了 LangChain 一半

3.Retrieval（向量检索的核心组件）

4.Agent（ReAct 模式 + LangGraph）

LlamaIndex 优先学这些：

1.Node Parser（文档怎么切分，比用什么 Embedding 更重要）

2.VectorStoreIndex + Retriever（核心检索流程）

3.Query Engine + Synthesizer（怎么合成答案）

4.LlamaHub（80+ 数据连接器，用过的都说香）

两者关系一句话： LlamaIndex 是数据索引的专家，LangChain 是应用编排的专家。RAG 场景里，它们是互补的——LlamaIndex 负责"找对数据"，LangChain 负责"把数据送进 LLM 并输出"。

四、最后说一句

方法论的东西，看完谁都觉得自己懂了。

真正的区别，在于你有没有用这套方法，认真学完一个完整的东西。

从 LangChain 或者 LlamaIndex 开始都可以，用六步法过一遍：

资料准备 → 提核心问题 → 画框架图 → 厘清边界 → 做题测试 → 内化沉淀

学完一个，你会有一种很奇怪的感觉——之前收藏夹里那些"以后再学"的东西，突然就觉得没那么难了。

因为你已经在主动构建，而不是被动接收了。

延伸阅读：

LangChain 官方文档：https://python.langchain.com/docs/
LlamaIndex 官方文档：https://docs.llamaindex.ai/