从生成式 AI 到 Vibe Coding 再到 AI Agent,我用一道「PDF 试题导入题库」的问题,亲历了这三个阶段——效率越来越高,但那段费力气的日子,反而是我真正读懂工具的时候。
◆ ◆ ◆
引子
将真题和联考卷的题目录入题库,都是 PDF 格式,听起来不算难,但真正动手,才发现水很深。
PDF 里的题目格式五花八门,有选择题、填空题、代码题;有的 PDF 是图片扫描件,有的是文字版;题号、选项、答案、解析散落各处,根本没有统一规律。如果手动复制粘贴,一份 8 页的卷子,整理下来要花大半天。
跟着 AI 工具的进化,一共经历了三个阶段来解决这个问题。每个阶段的体感都截然不同。
◆ ◆ ◆
01 第一阶段:生成式 AI,你是我的「翻译官」
最开始,我用的是最直接的方式——把 PDF 里的题目文字复制出来,粘到 Deepseek或者国内的大模型对话框里,然后用 prompt 告诉它:「请把这道题按 JSON 格式输出,包含题型、题目、选项、答案、解析」。
这个方法当时给我的感觉,用一个词来形容:「惊喜」。
以前这种结构化整理工作,要么手动,要么写复杂的正则表达式。现在告诉 AI 一句话,它居然真的能读懂题目的意图,正确地区分题干和选项,把答案从夹杂在文字里的「答案是 C」里识别出来,输出一个干净的 JSON 结构。
那时候的典型工作流:
① 打开 PDF,手动 Ctrl+A 全选文字
② 粘到对话框,附上结构化指令
③ 复制 AI 输出的 JSON,粘到本地文件
④ 手动检查有没有识别错误
⑤ 重复……重复……重复……
问题也很快暴露出来。手动复制本身就耗时间;遇到图片扫描的 PDF,文字根本复制不了;当题目很长、包含代码时,AI 经常截断或格式乱掉;而且每次都要手动反复操作,本质上你还是那个「人肉搬运工」,只不过换了个更聪明的翻译辅助你而已。
但即便如此,这个阶段带给我的收获是实实在在的:我需要认真琢磨怎么写 prompt,才能让 AI 稳定输出结构化内容。我花了大量时间反复测试——加约束、加示例、加边界条件,一点点把输出质量调高。这段时间,我对「如何跟 AI 对话」这件事,有了比大多数人更深的体感。
◆ ◆ ◆
02 第二阶段:Vibe Coding,让 AI 帮我写工具
大概是 2025 年12月,我开始用Trae辅助写代码,进入了很多人说的「Vibe Coding」阶段。
所谓 Vibe Coding,说白了就是:你用自然语言描述你想要什么,AI 帮你把代码写出来。你不需要是一个资深程序员,只需要能跟 AI 说清楚需求,然后在它给出的代码基础上不断调整、迭代。
我用这种方式,真的一行一行「捣鼓」出了一个 PDF 解析脚本。
# 我跟 AI 说的需求大概是这样:
"帮我写一个 Python 脚本,读取 PDF 文件,
识别里面的题目,题型有单选、多选、填空、代码题,
每道题提取题号、题干、选项、答案、解析,
输出成 JSON 格式,方便导入题库..."
AI 给出了用 pdfplumber 解析文字层、用正则匹配题号和选项的方案。我跑起来,发现识别率大概只有 60%——遇到跨页题目就乱,遇到代码块缩进就丢。
然后就是漫长的调试。每发现一个问题,我就去跟 AI 说「这里识别错了,你看一下原因,帮我改」。AI 给出修改方案,我测试,再反馈,再修改……就这样一来一回,迭代了几十轮。
这个过程说实话,是费力气的。有时候一个识别边界的问题,要改好几次才能稳定。我需要真正理解脚本的逻辑,才能给出有效的反馈——AI 不是神仙,你得告诉它「哪里错了、错在什么地方」,它才能帮你修。这就要求你自己也得懂一点。
Vibe Coding 阶段的真实体感:
• 你终于从「搬运工」变成了「工具的设计者」
• AI 是你的结对编程伙伴,而不是替代品
• 你需要懂得提问,懂得判断,懂得迭代
• 每一个修好的 bug,你都真正理解了为什么
• 做出来的东西,有一种「这是我的工具」的成就感
最终,这个脚本对文字层 PDF 的识别率做到了 90% 以上,我还顺手做了个简单的界面,可以批量拖入 PDF 文件、一键导出 JSON,对接到我的题库系统。
这个阶段,我也顺手做了很多其他的东西。用 AI 辅助写代码,做了一个「7 选 3 赋分工具」,做了一个会议记录助手,做了给算法题自动生成讲解视频的工具……每一个项目,都是「用自然语言描述需求 + 和 AI 来回调试」这套路子走下来的。
这些工具是我真正想要的,它们解决了我真实的问题。这种感觉,不是单纯"用"AI 对话能给的。
【统信可用】“多平台7选3学科一键智能赋分”工具下载及使用说明
◆ ◆ ◆
03 第三阶段:AI Agent,「算了,你来」
2026 年,AI Agent 工具迎来了一次跃升。Trae solo ,workbuddy,Claude Code、Cursor Agent、各类 MCP 工具组合……AI 不再只是「帮你写某个函数」,而是能够自己打开文件、执行命令、检查错误、读取输出、再调整方向,把一个完整的任务从头跑到尾。
一份pdf试题,导入题库,只需要一条指令即可:
【人工智能案例】Claude code操作浏览器填写复杂表单
我在 Vibe Coding 阶段,花了大约两周时间、迭代几十轮才做出的东西,Agent 用了不到二十分钟。关键是全程零手动,只需核验。
我不是在使用一个黑盒,而是在指挥一个懂行的助手。
更多案例:
【人工智能案例】Claude code自然语言剪辑视频?是的,并且效果还不错!
【人工智能案例】Claude code + remotion(skill)取代AE生成特效,制作视频
【人工智能】WorkBuddy 全面突围:从腾讯内部「摸鱼神器」到一人公司的「数字军团」
◆ ◆ ◆
04 工具进化了,那段「笨功夫」算什么?
有人会问:既然 AI Agent 能几分钟搞定,之前那费的那些劲,是不是都白费了?
我的答案是:不后悔。
首先,工具是有时代的。两年前根本没有今天这种 Agent 工具——AI 进化的速度是非线性的,你不能拿着 2026 年的工具回头说 2025 年的人「效率太低」。
其次,也是更重要的一点:那段「费力气」的过程,让我真正理解了问题本身。我知道 PDF 解析的难点在哪里,知道识别失败的常见原因,知道什么样的结构化输出是合理的,知道一个题库系统应该有哪些字段。
这些理解,不是 Agent 能给我的。Agent 会帮我做,但如果我什么都不懂,我连它做对没有都判断不了。
还有一点,我在 Vibe Coding 阶段做的那些工具——赋分工具、会议记录助手、算法讲解视频——它们真实地解决了我的问题,节省了我大量时间,还发出去被同行用着。这些产出不会因为 Agent 更快而消失,它们是那段时间实实在在的成果。
更不用说,在「和 AI 协作」这件事上,我比很多人多了一些积累。我知道怎么表达需求、怎么验证输出、怎么识别 AI 的幻觉……这些能力,在 Agent 时代反而更值钱。
三个阶段,收获对比:
生成式 AI 时代 → 学会了提问,理解了 prompt 工程,知道了如何让 AI 稳定输出结构化内容
Vibe Coding 时代 → 学会了把需求拆解成可执行的步骤,学会了和 AI 协作调试,建立了对问题域的深入理解,真实产出了有用的工具
AI Agent 时代 → 真正把「想法」和「实现」之间的距离压缩到最小,用前两个阶段的理解去驾驭 Agent 而不是被它带着走
◆ ◆ ◆
05 工具是工具,解决问题才是核心
我身边有两类人,都让我觉得走了弯路。
一类是技术焦虑型:天天追着新工具跑,今天学 ChatGPT,明天学 Cursor,后天学 Claude Code,但问他「你用 AI 解决了什么实际问题」,他说不出来。工具装了一堆,问题一个没少。
另一类是工具怀疑型:「AI 也就是个玩具,还是得靠自己」「等 AI 真正稳定了再说」——结果别人已经用 Agent 一天产出了一周的工作量,他还在手动复制粘贴。
真正应该有的姿态,我觉得是这样的:
先有一个真实的问题,然后用当下最合适的工具去解决它。
工具在进化,解决问题的逻辑不变。生成式 AI 是解决「结构化整理」问题最好的工具;Vibe Coding 是解决「写一个解析脚本」最好的方式;现在,AI Agent 是端到端完成这类任务最高效的路径。
工具换了,但我面对的问题是同一个,解决问题的判断力也一直在积累。
很多人问我,现在学 AI 应用,还有必要从基础学起吗?我的回答是:不需要从底层原理学起,但一定要从真实问题学起。拿一个你自己每天都在头疼的事情,用现在的工具去解决它,然后在解决的过程中自然而然地学会了工具。这比刷一百个教程都管用。
AI Agent 已经把门槛压得很低了。以前「会用 AI」和「会用 AI 做东西」中间隔着一道编程的墙——现在这道墙几乎不存在了。你想要什么,说清楚,Agent 帮你实现,你来验证和把关。
但「说清楚需求」和「把关输出质量」这两件事,恰恰是那段「笨功夫」练出来的。
◆ ◆ ◆
尾声
每次打开题库系统,我都会想起那段一题一题手动整理的下午,想起 Vibe Coding 时代调试那个脚本到凌晨的晚上,想起 AI Agent 第一次独立跑完全流程时我盯着屏幕的那种感觉——有点震撼,但更多的是「嗯,我知道它在干什么」。
工具进化了,那段笨功夫成了底气。
这大概就是和 AI 一起工作这几月,我觉得最值得讲的一件事。
— END —
如果这篇文章对你有用,欢迎转发给同样在用 AI 工具的朋友。
你也有类似的「用工具进化解决同一个问题」的经历?欢迎留言聊聊。
夜雨聆风