【人工智能】从生成式AI到Vibe Coding到AI Agent,那段「笨功夫」我不后悔

从生成式 AI 到 Vibe Coding 再到 AI Agent，我用一道「PDF 试题导入题库」的问题，亲历了这三个阶段——效率越来越高，但那段费力气的日子，反而是我真正读懂工具的时候。

◆ ◆ ◆

引子

将真题和联考卷的题目录入题库，都是 PDF 格式，听起来不算难，但真正动手，才发现水很深。

PDF 里的题目格式五花八门，有选择题、填空题、代码题；有的 PDF 是图片扫描件，有的是文字版；题号、选项、答案、解析散落各处，根本没有统一规律。如果手动复制粘贴，一份 8 页的卷子，整理下来要花大半天。

跟着 AI 工具的进化，一共经历了三个阶段来解决这个问题。每个阶段的体感都截然不同。

◆ ◆ ◆

01 第一阶段：生成式 AI，你是我的「翻译官」

最开始，我用的是最直接的方式——把 PDF 里的题目文字复制出来，粘到 Deepseek或者国内的大模型对话框里，然后用 prompt 告诉它：「请把这道题按 JSON 格式输出，包含题型、题目、选项、答案、解析」。

这个方法当时给我的感觉，用一个词来形容：「惊喜」。

以前这种结构化整理工作，要么手动，要么写复杂的正则表达式。现在告诉 AI 一句话，它居然真的能读懂题目的意图，正确地区分题干和选项，把答案从夹杂在文字里的「答案是 C」里识别出来，输出一个干净的 JSON 结构。

那时候的典型工作流：
① 打开 PDF，手动 Ctrl+A 全选文字
② 粘到对话框，附上结构化指令
③ 复制 AI 输出的 JSON，粘到本地文件
④ 手动检查有没有识别错误
⑤ 重复……重复……重复……

问题也很快暴露出来。手动复制本身就耗时间；遇到图片扫描的 PDF，文字根本复制不了；当题目很长、包含代码时，AI 经常截断或格式乱掉；而且每次都要手动反复操作，本质上你还是那个「人肉搬运工」，只不过换了个更聪明的翻译辅助你而已。

但即便如此，这个阶段带给我的收获是实实在在的：我需要认真琢磨怎么写 prompt，才能让 AI 稳定输出结构化内容。我花了大量时间反复测试——加约束、加示例、加边界条件，一点点把输出质量调高。这段时间，我对「如何跟 AI 对话」这件事，有了比大多数人更深的体感。

◆ ◆ ◆

02 第二阶段：Vibe Coding，让 AI 帮我写工具

大概是 2025 年12月，我开始用Trae辅助写代码，进入了很多人说的「Vibe Coding」阶段。

所谓 Vibe Coding，说白了就是：你用自然语言描述你想要什么，AI 帮你把代码写出来。你不需要是一个资深程序员，只需要能跟 AI 说清楚需求，然后在它给出的代码基础上不断调整、迭代。

我用这种方式，真的一行一行「捣鼓」出了一个 PDF 解析脚本。

# 我跟 AI 说的需求大概是这样：

"帮我写一个 Python 脚本，读取 PDF 文件，

识别里面的题目，题型有单选、多选、填空、代码题，

每道题提取题号、题干、选项、答案、解析，

输出成 JSON 格式，方便导入题库..."

AI 给出了用 pdfplumber 解析文字层、用正则匹配题号和选项的方案。我跑起来，发现识别率大概只有 60%——遇到跨页题目就乱，遇到代码块缩进就丢。

然后就是漫长的调试。每发现一个问题，我就去跟 AI 说「这里识别错了，你看一下原因，帮我改」。AI 给出修改方案，我测试，再反馈，再修改……就这样一来一回，迭代了几十轮。

这个过程说实话，是费力气的。有时候一个识别边界的问题，要改好几次才能稳定。我需要真正理解脚本的逻辑，才能给出有效的反馈——AI 不是神仙，你得告诉它「哪里错了、错在什么地方」，它才能帮你修。这就要求你自己也得懂一点。

Vibe Coding 阶段的真实体感：
• 你终于从「搬运工」变成了「工具的设计者」
• AI 是你的结对编程伙伴，而不是替代品
• 你需要懂得提问，懂得判断，懂得迭代
• 每一个修好的 bug，你都真正理解了为什么
• 做出来的东西，有一种「这是我的工具」的成就感

最终，这个脚本对文字层 PDF 的识别率做到了 90% 以上，我还顺手做了个简单的界面，可以批量拖入 PDF 文件、一键导出 JSON，对接到我的题库系统。

这个阶段，我也顺手做了很多其他的东西。用 AI 辅助写代码，做了一个「7 选 3 赋分工具」，做了一个会议记录助手，做了给算法题自动生成讲解视频的工具……每一个项目，都是「用自然语言描述需求 + 和 AI 来回调试」这套路子走下来的。

这些工具是我真正想要的，它们解决了我真实的问题。这种感觉，不是单纯"用"AI 对话能给的。

【统信可用】“多平台7选3学科一键智能赋分”工具下载及使用说明

【全平台】“7 选 3 学科一键智能赋分工具”升级！

【本地~全平台】浙江省首考成绩诊断报告详细分析工具

◆ ◆ ◆

03 第三阶段：AI Agent，「算了，你来」

2026 年，AI Agent 工具迎来了一次跃升。Trae solo ，workbuddy，Claude Code、Cursor Agent、各类 MCP 工具组合……AI 不再只是「帮你写某个函数」，而是能够自己打开文件、执行命令、检查错误、读取输出、再调整方向，把一个完整的任务从头跑到尾。

一份pdf试题，导入题库，只需要一条指令即可：

【人工智能案例】Claude code操作浏览器填写复杂表单

【人工智能案例】oj题库自动录入客观题演示

我在 Vibe Coding 阶段，花了大约两周时间、迭代几十轮才做出的东西，Agent 用了不到二十分钟。关键是全程零手动，只需核验。

我不是在使用一个黑盒，而是在指挥一个懂行的助手。

【人工智能案例】Claude code做题目视频解析初尝试

【人工智能案例】Claude code + remotion(skill)取代AE生成特效，制作视频

【人工智能】WorkBuddy 全面突围：从腾讯内部「摸鱼神器」到一人公司的「数字军团」

◆ ◆ ◆

04 工具进化了，那段「笨功夫」算什么？

有人会问：既然 AI Agent 能几分钟搞定，之前那费的那些劲，是不是都白费了？

我的答案是：不后悔。

首先，工具是有时代的。两年前根本没有今天这种 Agent 工具——AI 进化的速度是非线性的，你不能拿着 2026 年的工具回头说 2025 年的人「效率太低」。

其次，也是更重要的一点：那段「费力气」的过程，让我真正理解了问题本身。我知道 PDF 解析的难点在哪里，知道识别失败的常见原因，知道什么样的结构化输出是合理的，知道一个题库系统应该有哪些字段。

这些理解，不是 Agent 能给我的。Agent 会帮我做，但如果我什么都不懂，我连它做对没有都判断不了。

还有一点，我在 Vibe Coding 阶段做的那些工具——赋分工具、会议记录助手、算法讲解视频——它们真实地解决了我的问题，节省了我大量时间，还发出去被同行用着。这些产出不会因为 Agent 更快而消失，它们是那段时间实实在在的成果。

更不用说，在「和 AI 协作」这件事上，我比很多人多了一些积累。我知道怎么表达需求、怎么验证输出、怎么识别 AI 的幻觉……这些能力，在 Agent 时代反而更值钱。

三个阶段，收获对比：

生成式 AI 时代 → 学会了提问，理解了 prompt 工程，知道了如何让 AI 稳定输出结构化内容

Vibe Coding 时代 → 学会了把需求拆解成可执行的步骤，学会了和 AI 协作调试，建立了对问题域的深入理解，真实产出了有用的工具

AI Agent 时代 → 真正把「想法」和「实现」之间的距离压缩到最小，用前两个阶段的理解去驾驭 Agent 而不是被它带着走

◆ ◆ ◆

05 工具是工具，解决问题才是核心

我身边有两类人，都让我觉得走了弯路。

一类是技术焦虑型：天天追着新工具跑，今天学 ChatGPT，明天学 Cursor，后天学 Claude Code，但问他「你用 AI 解决了什么实际问题」，他说不出来。工具装了一堆，问题一个没少。

另一类是工具怀疑型：「AI 也就是个玩具，还是得靠自己」「等 AI 真正稳定了再说」——结果别人已经用 Agent 一天产出了一周的工作量，他还在手动复制粘贴。

真正应该有的姿态，我觉得是这样的：

先有一个真实的问题，然后用当下最合适的工具去解决它。

工具在进化，解决问题的逻辑不变。生成式 AI 是解决「结构化整理」问题最好的工具；Vibe Coding 是解决「写一个解析脚本」最好的方式；现在，AI Agent 是端到端完成这类任务最高效的路径。

工具换了，但我面对的问题是同一个，解决问题的判断力也一直在积累。

很多人问我，现在学 AI 应用，还有必要从基础学起吗？我的回答是：不需要从底层原理学起，但一定要从真实问题学起。拿一个你自己每天都在头疼的事情，用现在的工具去解决它，然后在解决的过程中自然而然地学会了工具。这比刷一百个教程都管用。

AI Agent 已经把门槛压得很低了。以前「会用 AI」和「会用 AI 做东西」中间隔着一道编程的墙——现在这道墙几乎不存在了。你想要什么，说清楚，Agent 帮你实现，你来验证和把关。

但「说清楚需求」和「把关输出质量」这两件事，恰恰是那段「笨功夫」练出来的。

◆ ◆ ◆

尾声

每次打开题库系统，我都会想起那段一题一题手动整理的下午，想起 Vibe Coding 时代调试那个脚本到凌晨的晚上，想起 AI Agent 第一次独立跑完全流程时我盯着屏幕的那种感觉——有点震撼，但更多的是「嗯，我知道它在干什么」。

工具进化了，那段笨功夫成了底气。

这大概就是和 AI 一起工作这几月，我觉得最值得讲的一件事。

— END —

如果这篇文章对你有用，欢迎转发给同样在用 AI 工具的朋友。
你也有类似的「用工具进化解决同一个问题」的经历？欢迎留言聊聊。