乐于分享
好东西不私藏

语言:AI与人的本质共鸣

语言:AI与人的本质共鸣

我与AI的成长轨迹:从震惊到共生

导读:我们构建Agent的过程,本质是塑造一个“类人”存在——接受它的不完美,善用它调用工具、解决问题的能力,便是AI与人类最理想的共生之道。这篇文章记录了我与AI相处的真实瞬间,从半小时落地实用工具到协同解锁陌生领域,在一次次实践中,读懂这场AI革命的真正意义。

全世界都在谈论AI、学习AI、使用AI。每周一个新名词,每月一个新架构,每三个月一次模型大迭代——一场真正意义上的革命正在发生。相较于上一次被称作互联网(含移动互联网)的革命,这更像是一场深刻的人类认知革命:它所冲击的,是脑力工作者的核心价值,是我们数十年寒窗苦读所积累的知识体系与工作模式。

关于AI的倒叙记忆:那些颠覆认知的瞬间

1. AI以破坏性创新的方式,解决了我无解的难题

一周前,我计划将自己的产品文档通过Obsidian进行本地化管理,方便后续借助Claude Code等AI工具辅助产品设计。这个过程需要将Wiki文档转换成Markdown格式,我很快找到了对应的转换插件,却也迅速陷入困境:由于网络代理问题,转换后的文件始终无法下载。

我大致清楚,需要通过插件模拟浏览器Cookie来绕过登录验证,但搜遍全网,要么是相关Chrome插件已被下架,要么是方法过时无法解决。我先后咨询了Gemini和豆包,它们给出的建议都是修改Obsidian插件的配置项——可实际上,这个配置项根本不存在,这是AI产生的幻觉。我研究到深夜,问题依旧毫无进展。

第二天回到办公室,我打开Claude免费版,大致描述了自己的问题。令我意外的是,它不仅帮我梳理出清晰的解决流程并画出流程图,我试着追问能否帮我编写一个专属插件,短短几十秒后,它就生成了完整的插件代码。我尝试本地部署时遇到了新问题,便截图发给它,来回沟通不过半小时,这个插件竟然真的能正常运行,完美解决了下载图片需要登录态的问题——如今,我已经打算将这个插件提交到Obsidian社区,供更多人使用。

那一刻,我彻底被震撼了:这是我第一次用AI,在半小时内落地一个可直接使用的工具,它打破了我对“AI只能提供思路”的固有认知。

2. 工具带来的真切体验

一个月前,“龙虾”相关AI工具的浪潮席卷而来。起初我并未急于体验,而是先尝试了腾讯的WorkBuddy。当它用几分钟时间,帮我生成了一个用于编写PRD文档的Skill,安装后还能读取本地文件,并参照这个Skill输出令我满意的文档时,我真切地感觉到,像贾维斯一样的智能助手,真的走进了现实。

3. Claude Code:完整覆盖小型项目的全开发链路

春节前,我第一次付费体验AI工具,通过闲鱼订阅了一个月的Claude套餐。当时我随口提了一个需求:开发一个ETF投资策略的Web端应用。没想到,Claude在接下来的半小时里,完整走完了从需求梳理、规划方案、技术选型,到前端开发、后端开发、测试、部署的全流程。期间,它还会不断和我确认需求细节、敲定技术架构,自主编写测试用例、执行测试流程。

我被这样的全流程闭环彻底震撼——尽管最终系统的可用性只有50%,但问题并非出在AI身上,而是我自己对需求的认知本身就不够清晰,甚至不知道自己真正想要什么。但这一次,让我第一次真切感受到:AI已经强大到可以独立承载一个小型项目的完整开发。

4. 与Gemini协同,开启智客AI设计

2025年末,当架构师(AI领域的大神)给到我Vercel AI SDK框架后,我先通过阅读技术文档掌握了基础概念,随后第一版产品文档,便是我和Gemini共同讨论打磨出来的。简单的设计思路,结合参考的技术架构,我们很快确定了Loop的核心方向。Gemini帮我理清了前后端的实现细节,把那些原本晦涩难懂、摸不透的技术点,转化成了实实在在、可落地的产品文档。

后续的每一次功能迭代和交互优化,都建立在这一轮深入沟通的基础上。AI成了我学习陌生领域的“导师”:从Agent-Loop、Tool配置(输入输出结构化)、HITL(Human in the Loop,人机协同)、Skills,到渐进式开发的相关概念……在它的辅助下,我慢慢构建起了一套完善的AI产品架构。

5. 关于Workflow:效率优先,不盲目跟风

无论是Diffy还是Coze这类Workflow(工作流)工具,都不是我理想中的模式——本质上,它们的效率不如直接编码。因此,整个2025年,我始终没有急于去尝试这类工具,更倾向于选择能直接解决核心问题、效率更高的方式。

6. 预测Next Token:一场持续十几年的“游戏”终获突破

GPT刚出现时,我第一次用它生成了一份有模有样的裂变活动营销案,当时的兴奋难以言表,有种“长期期待终于迎来突破”的感慨。至于深度学习、卷积神经网络(CNN)这些底层概念,我已经记不太清了。我只记得十几年前那场 AI 狂潮——当时,AlphaGo 在围棋棋盘上战胜了人类,而更早的 IBM Watson 则在知识问答节目中一战成名。记得大学暑假,有一个关于金融领域的问答类项目,我最终没有参与。

再后来工作的几年里,总能断断续续听到深度学习、图像识别的相关理论和技术进展,却始终觉得“人工智能离实际应用还很遥远”。没想到,十几年过去,AI依然沿用着“预测下一个Token(令牌,而非单纯的word)”的核心逻辑,大力出奇迹。

语言:AI与人的本质共鸣

AI的核心,依然是那场“预测Next Token”的游戏。但细细想来,人类使用语言的过程,不也正是一场“预测下一个文字”的过程吗?当机器真正学会了语言,或许它就能真正变得和人类一样——不再是追求100%的绝对正确,不再是机械地执行指令,而是像人一样会“遗忘”、会出纰漏、会主动使用工具、会尝试各种解决办法,最终给出一个未必完美,但一定有价值的结果。

我们在构建Agent(智能体)的过程,其实也是在塑造一个“类人”的存在:它不必做到100%正确,但它能学会编写程序,去执行那些需要100%精准的程序代码——这,或许就是AI与人类最理想的共生状态。