最近翻到 2025 年 5 月 13 日的组会 PPT,感慨万千。

把记忆再往前拨一点,2023 年底到 2024 年,耳边还常听到几种论点:scaling law 到头了、大模型进入下半场……
现在回头看,根本不是下半场,那只是个开始。
一年过去,用一句话概括:
AI 成为了工作、学习和生活的默认环境,我成为了 AI 原住民。
我真切感受到一场全方位的工业革命在持续发生。
这一年,像过了一个时代,回不去了。
我知道这句话很大。
但证据不是某一个炫技 demo,而是科研、工程、生活同时被改写。
这种变化的意义,绝不亚于瓦特改良蒸汽机。
01 赶不上趟的科研
第一个证据,是模型进步的速度。
过去一年,我最直接的感受是:基模能力的进步快到追不上。
始于 2025 年 3 月初,我尝试把 AI 技术融入科研工作,号称要用 LLM-Native 的方法做模拟芯片设计。

一开始尝试用 ChatGPT 和 deepseek 解读网表,写 Cadence SKILL 命令。
基本是望文生义,效果很差。
经过一些早期尝试,很快走上了 Agent 路线。
2025 年 5 月 13 日这份组会 PPT,就是当时的一个切片。

现在回头看,非标模拟版图和复杂模拟电路设计当然还很困难。
但表格里很多当时还停留在畅想阶段的功能,今天只要让 Claude Code / Codex 接上设计环境,基本已经可以直接实现。
当时还手搓了 RAG,检索 10 万页的文档。

手搓服务器状态分析系统。

用的还是硅基流动的 Deepseek。
现在看起来,这些东西当然有点朴素。
后来我们花了几个月的时间手搓 Agent。
这条路不是没有成果,有幸发了一篇 CCF-A 类会议和另外两篇其他会议。
但越往后做,越能感觉到,真正决定上限的不是 Harness,而是基模。
到 10 月份,我尝试引入所谓动态知识库、动态工具集,希望系统能根据任务自动加载知识、工具和上下文。
2025 年 10 月 27 日的组会 PPT 里,我还在讲这件事。

而就在同一时期,Anthropic 在 10 月 16 日发布博客《Equipping agents for the real world with Agent Skills》。
很快,skill 路线形成共识,完全算不上什么创新了。
我当时还尝试引入自进化机制,让系统在完成任务之后反过来总结经验、沉淀流程、改进自己。

听起来很美,但逐渐发现,Harness 绕来绕去,最后明显卡在基模能力上。
基模能力行,流程就顺理成章。
基模能力不行,再漂亮的框架也离不开人工兜底。
这期间的基模进步速度有多么夸张?
拉扎维写了一篇《Analog Design Experiments With AI—Part 1 [The Analog Mind]》,发表在 IEEE Solid-State Circuits Magazine 2025 年秋季刊。
里面说,40 道模拟电路题,让 GPT (看时间应该是GPT-4o) 作答,正确率只有 41%,所以 AI 不行。
很快有人用 Gemini 复现,正确率立即到达 91%。
一代模型更新的速度,能把整个 benchmark 掀了。
2025 年 9月,我尝试让 GPT-5 解释共栅放大器噪声的小信号模型。
原始提问是图文混合多模态输入:

GPT-5 原始输出的截图一:

截图二:

截图三:

惊呼震撼之余,我很清楚地感觉到,模型对电路的理解能力已经跨过了一个台阶。
到 2026 年初,明显体会到:
但凡是有明文的内容,但凡语言化了,能被读到、搜到、解析、放进上下文里、命令行执行,通用 Agent 基本都能直接打穿。
而且更关键的是,这种扩张还没有停下来。
明显感觉到,基模的能力边界仍然在继续向外扩。
这对科研来说太刺激,也很尴尬。
辛辛苦苦设计的系统,很可能不是因为错了而失效。
而是因为模型进步太快,它还没来得及成为基础设施,就先变成了过渡方案。
这就是我说的“赶不上趟”。
但这种“赶不上趟”,恰恰说明这是一场狂飙突进的革命。
02 比游戏还上瘾的 vibe coding
第二个证据是工程体验的改变。
2025 年 10 月,在朋友的力荐下,我抛弃了 Cursor,开始使用 Claude Code。
Claude Code 把我的代码实现能力提升了上百倍。
我敢于走进一套相对正经的软件开发流程里,接触 pytest、git工作流、CI/CD,并且发布在 PyPI,真的可以被 `pip install` 安装并使用。

虽然这个 ADCToolbox 项目至今没有打磨完成,仍在内测中。
但是对我自己来说,它很重要。
它是我首次完全负责的超过一万行的项目。
标志着 AI 不只是帮我写了几段代码,而是把我从“能写一点代码”,带到了“能独立创造一个项目”。
到今天,我的 virtuoso-bridge-lite 获得了超过一万次浏览量、260+ stars、79 Fork,并且入选 oosmetrics Top 5 in Fullstack。
这在一年之前都是不可想象的。

仓库地址:
https://github.com/Arcadia-1/virtuoso-bridge-lite
收藏量增长曲线:

oosmetrics 通知截图:

更夸张的是,我充分感受到了 vibe coding 的快乐。
自 2025 年 10 月起,我发现 vibe coding 比任何游戏上瘾多了。
我在家里 vibe coding。
在办公室 vibe coding。
在火车上 vibe coding。
不舍得让电脑合上盖子。
我多次跟人说,自己被 Coding Agents 的惊人能力感动到流泪。
那种感觉像是一个人突然多出了一整套工程班子。
那段时间我废寝忘食地用。
甚至有一种很奇怪的紧迫感:
这么强的能力,会不会哪天突然用不上了?
03 陌生世界里的超级向导
第三个证据是生活方式的改变。
2025 年 7 月至 2026 年 1 月,我在瑞士。
我认为:AI shock 远远超过 culture shock。
AI 极大地扩展了我的认知半径,让我在陌生世界中活得从容。
第一,AI 是全能导游。
别人经常问我:你才来几周 / 几个月,怎么了解这么多?
我一路上看到的新奇标牌、标语、标志,陌生物品、风土人情,几乎全都都拍照丢给 AI 讲解一遍。
这样走过几周,当然会显得什么都懂。

去罗马旅行,ChatGPT 是最好的导游。
在废墟林立的古罗马广场,甚至能让我原地现学现卖,给别人讲解。
去柏林旅行,Gemini 是最深刻的伙伴。
在勃兰登堡门下,在柏林墙遗址,在波茨坦,走在每一处历史古迹前,我们聊它背后的战争、制度、艺术和人。
那种交流可以非常深刻,远不止是查资料。
这些讲解体验,远远超过了我过去花钱雇过的所有讲解型导游。
第二,AI 是健身教练。
在瑞士的其中四个月,我减了 20 斤。
全靠 ChatGPT 科学的规划、细致的辅导,以及我自己认真的执行。
每天该吃什么、训练什么,每组动作感受如何、下一组怎么调整。


第三,AI 是生活导师。
我去瑞士之前是不会做饭的。
完全靠 AI,我学会了煎牛排、煎三文鱼、意大利面、铁板奶酪、番茄奶酪等各式白人饭。
AI 告诉我先切什么,怎么切,先下什么,什么时候倒油、什么时候翻面、什么时候加盐,火大了怎么办,锅快糊了怎么办。

从柴米油盐酱醋茶,到超市里每一种陌生包装,几乎完全依靠 AI 指点。
这还真不只是因为我懒,主要是看不懂……
瑞士的官方语言有德语、法语、意大利语,很多告示牌上没有英语,很多商品的包装上也没有英语。
我统统拍给 AI 看,让它帮我解读、比较、推荐。
某种意义上,在这样的环境里生存半年,AI 绝对是立大功。

尾声
回到那份 2025 年 5 月 13 日的组会 PPT,当时很多想法还只是畅想。
一年之内,科研前沿几次换挡,很多当时的畅想直接被基模能力碾压。
工程上,vibe coding 极大解放生产力,更多的创意可以落地。
生活里,AI 变成默认伙伴,认知半径被猛然扩张。
我现在无法离开 AI,就像现代人无法离开电力一样。
冰心说:读书好,好读书,读好书。
放到今天这场新的革命里,几乎可以原样平移:
用 AI 好,好用 AI,用好 AI。
势必是下一代人的基本生存能力。

夜雨聆风