语言:AI与人的本质共鸣

我与AI的成长轨迹：从震惊到共生

导读：我们构建Agent的过程，本质是塑造一个“类人”存在——接受它的不完美，善用它调用工具、解决问题的能力，便是AI与人类最理想的共生之道。这篇文章记录了我与AI相处的真实瞬间，从半小时落地实用工具到协同解锁陌生领域，在一次次实践中，读懂这场AI革命的真正意义。

全世界都在谈论AI、学习AI、使用AI。每周一个新名词，每月一个新架构，每三个月一次模型大迭代——一场真正意义上的革命正在发生。相较于上一次被称作互联网（含移动互联网）的革命，这更像是一场深刻的人类认知革命：它所冲击的，是脑力工作者的核心价值，是我们数十年寒窗苦读所积累的知识体系与工作模式。

关于AI的倒叙记忆：那些颠覆认知的瞬间

1. AI以破坏性创新的方式，解决了我无解的难题

一周前，我计划将自己的产品文档通过Obsidian进行本地化管理，方便后续借助Claude Code等AI工具辅助产品设计。这个过程需要将Wiki文档转换成Markdown格式，我很快找到了对应的转换插件，却也迅速陷入困境：由于网络代理问题，转换后的文件始终无法下载。

我大致清楚，需要通过插件模拟浏览器Cookie来绕过登录验证，但搜遍全网，要么是相关Chrome插件已被下架，要么是方法过时无法解决。我先后咨询了Gemini和豆包，它们给出的建议都是修改Obsidian插件的配置项——可实际上，这个配置项根本不存在，这是AI产生的幻觉。我研究到深夜，问题依旧毫无进展。

第二天回到办公室，我打开Claude免费版，大致描述了自己的问题。令我意外的是，它不仅帮我梳理出清晰的解决流程并画出流程图，我试着追问能否帮我编写一个专属插件，短短几十秒后，它就生成了完整的插件代码。我尝试本地部署时遇到了新问题，便截图发给它，来回沟通不过半小时，这个插件竟然真的能正常运行，完美解决了下载图片需要登录态的问题——如今，我已经打算将这个插件提交到Obsidian社区，供更多人使用。

那一刻，我彻底被震撼了：这是我第一次用AI，在半小时内落地一个可直接使用的工具，它打破了我对“AI只能提供思路”的固有认知。

2. 工具带来的真切体验

一个月前，“龙虾”相关AI工具的浪潮席卷而来。起初我并未急于体验，而是先尝试了腾讯的WorkBuddy。当它用几分钟时间，帮我生成了一个用于编写PRD文档的Skill，安装后还能读取本地文件，并参照这个Skill输出令我满意的文档时，我真切地感觉到，像贾维斯一样的智能助手，真的走进了现实。

3. Claude Code：完整覆盖小型项目的全开发链路

春节前，我第一次付费体验AI工具，通过闲鱼订阅了一个月的Claude套餐。当时我随口提了一个需求：开发一个ETF投资策略的Web端应用。没想到，Claude在接下来的半小时里，完整走完了从需求梳理、规划方案、技术选型，到前端开发、后端开发、测试、部署的全流程。期间，它还会不断和我确认需求细节、敲定技术架构，自主编写测试用例、执行测试流程。

我被这样的全流程闭环彻底震撼——尽管最终系统的可用性只有50%，但问题并非出在AI身上，而是我自己对需求的认知本身就不够清晰，甚至不知道自己真正想要什么。但这一次，让我第一次真切感受到：AI已经强大到可以独立承载一个小型项目的完整开发。

4. 与Gemini协同，开启智客AI设计

2025年末，当架构师（AI领域的大神）给到我Vercel AI SDK框架后，我先通过阅读技术文档掌握了基础概念，随后第一版产品文档，便是我和Gemini共同讨论打磨出来的。简单的设计思路，结合参考的技术架构，我们很快确定了Loop的核心方向。Gemini帮我理清了前后端的实现细节，把那些原本晦涩难懂、摸不透的技术点，转化成了实实在在、可落地的产品文档。

后续的每一次功能迭代和交互优化，都建立在这一轮深入沟通的基础上。AI成了我学习陌生领域的“导师”：从Agent-Loop、Tool配置（输入输出结构化）、HITL（Human in the Loop，人机协同）、Skills，到渐进式开发的相关概念……在它的辅助下，我慢慢构建起了一套完善的AI产品架构。

5. 关于Workflow：效率优先，不盲目跟风

无论是Diffy还是Coze这类Workflow（工作流）工具，都不是我理想中的模式——本质上，它们的效率不如直接编码。因此，整个2025年，我始终没有急于去尝试这类工具，更倾向于选择能直接解决核心问题、效率更高的方式。

6. 预测Next Token：一场持续十几年的“游戏”终获突破

GPT刚出现时，我第一次用它生成了一份有模有样的裂变活动营销案，当时的兴奋难以言表，有种“长期期待终于迎来突破”的感慨。至于深度学习、卷积神经网络（CNN）这些底层概念，我已经记不太清了。我只记得十几年前那场 AI 狂潮——当时，AlphaGo 在围棋棋盘上战胜了人类，而更早的 IBM Watson 则在知识问答节目中一战成名。记得大学暑假，有一个关于金融领域的问答类项目，我最终没有参与。

再后来工作的几年里，总能断断续续听到深度学习、图像识别的相关理论和技术进展，却始终觉得“人工智能离实际应用还很遥远”。没想到，十几年过去，AI依然沿用着“预测下一个Token（令牌，而非单纯的word）”的核心逻辑，大力出奇迹。

语言：AI与人的本质共鸣

AI的核心，依然是那场“预测Next Token”的游戏。但细细想来，人类使用语言的过程，不也正是一场“预测下一个文字”的过程吗？当机器真正学会了语言，或许它就能真正变得和人类一样——不再是追求100%的绝对正确，不再是机械地执行指令，而是像人一样会“遗忘”、会出纰漏、会主动使用工具、会尝试各种解决办法，最终给出一个未必完美，但一定有价值的结果。

我们在构建Agent（智能体）的过程，其实也是在塑造一个“类人”的存在：它不必做到100%正确，但它能学会编写程序，去执行那些需要100%精准的程序代码——这，或许就是AI与人类最理想的共生状态。