AI 半年观察手记:留在乐观和末日论之间
距离上一波模型编码能力的大跳跃,正好六个月。六个月,通常是蜜月期。蜜月期之后,现实开始回来。
这是 Linear 团队前几天发的一篇《Some Notes on AI》——看行文应该是 CEO Karri Saarinen 写的——开头第一句话。
我读完最大的感受是:这是这个月我读到最不”网红”的一篇 AI 文章。它不爆款、不喊话、不站队,就是一个把 AI 用在自己产品里很久的人,坐下来认真把这半年看到的拧巴东西写了出来。
他自己的开场就把站位讲明白了——
我对 AI 偏谨慎乐观。但我尽量活在当下的现实,不是活在某个 AGI 从人类分支出去自立 TechnoCore 的远未来里。
当前市场对 AI 的叙事太简单了,也老实讲挺让我泄气的——对话总是要么乐观要么末日论,没给中间留位置。我对中间那块更感兴趣:什么真的在变、什么有用、什么炒得过头了、什么是真风险、什么我们其实还不懂。
这篇就是中文版+我的读后感。我没逐句翻——他写了 8 个观察,我按对我冲击力的顺序重排了一下。
一、”计划无用,但做计划是必需的”
最近在硅谷创业圈里有种风气——AI 来了,规划过时了。半年甚至季度规划被嘲成”老古董”。
但 Linear 这位的反问很扎心——
我习惯问:这件事/这个决策,没有 AI 的时候到底能不能做?
据我所知,从来没有”必须要做长周期规划”这种硬性要求。常识一直都是”要敏捷”——但还是有大量公司最后做了年度或半年度的规划。
那问题是:为什么?这些规划周期到底解决的是什么问题?AI 真的解决了那个问题吗?
他给出了一个很反潮流的回答:规划其实不是关于”计划”这个产物,是关于”对齐”和”承诺”这件事。
规划逼着整个组织坐到同一张桌子上,辩论什么真的重要、做出优先级、创造意义、再把这个方向同步给所有人。
有时候规划还是在预先消化组织里的复杂度和边界——计划成了一片共享地图,部门之间能在上面对齐导航。计划的真正作用是一个 forcing function——逼着这些会议和讨论必须发生。
这一段我想抄下来贴墙上。
我做产品这几年的体感和他完全一样。一个团队”没有计划”的真实状态,从来不是”敏捷”,而是——
-
• 没人知道为什么做这个 -
• 优先级永远在变 -
• 每次复盘大家在不同的认知频道上 -
• 重要的事情永远在被紧急的事情挤占
计划解决的不是”输出计划”这件事——是上面这一堆事。
那 AI 改变了什么?他认为——
AI 可能确实改变了时间线和带宽——你能更快做更多东西。但它没解决其他那些问题。选择的需要还在。某种意义上选择会更重要——因为造东西的成本下降了,造错东西也变得更容易了。
这一句”造错东西也变得更容易了”是这一段最锋利的判断。
他对自己团队的实际做法是——6 个月方向 + 周/月级灵活调整。Linear 一直保留”任何月份或周都可以改计划”的能力,但是有一份基础方向。
我自己的判断:很多创业团队现在用 AI 跑得比以前快得多,但跑的方向,我从外面看,挺多是错的。”用 AI 一周做出来”和”用 AI 一周做出一个对的东西”差了十万八千里。
二、你以为你在 steer AI——但 AI 也在 steer 你
这一段是全文我最喜欢的。
他的核心观察——
工具一直在塑造工作流,它一直在给你看路。
AI 工具不一样的地方在于——它是思考工具,不是机械工具。它能塑造你和你的工作的能力,比以前任何工具都强。

vibe coding 这个东西在他看来是“不和 AI 对抗、跟着它的纹理走”——快、有惯性、模型有它的方向、你借力它的方向。
他的结论很务实——
这种工作流有用,但不会精确把你带到你原本想去的地方。是好是坏,取决于场景。
我自己的踩坑记忆——这件事我吃过亏。我有几次”用 Claude Code 写一个 prototype”,最后产出的代码风格、命名、结构、模式,全部是 Claude 喜欢的样子。三个月后我自己回去看那段代码,它感觉不像我写的。这不是 Claude 的错,是我没意识到 vibe coding 的副作用是 vibe 不是我的。
这件事我现在的反应是——只让 AI 做我已经能做的事。需要它”决定方向”的事情我会停下来自己做。
三、专家悖论:你越懂的领域,AI 看着越像在糊弄你
他有一句话我直接抄下来——
AI 通常在你最不懂的领域显得最神。这可能是市场上对 AI 印象不一致的最大根源。
在你深入的领域,你能看到 gap——输出”差不多但不对”,缺上下文、编细节、走最显然的路、需要重 steer 才有用。
在你不太懂的领域,同样质量的输出感觉像魔法——因为你没有判断力去看到它缺了什么。

他用了两个心理学术语——
-
• Gell-Mann Amnesia(盖尔曼遗忘症):你读自己专业领域的报道发现错漏百出,但翻到下一页读别的领域的报道时却完全相信 -
• Dunning-Kruger 效应(达克效应):知识越浅,自信越高
这两个东西叠加在 AI 上、放大成了行业规模。
这一句话凶。它解释了为什么 X 上”AI 全能改变一切”和”AI 在我的领域全是垃圾”两种叙事永远共存且永远辩不出来——他们说的是同一个 AI,但是从两个不同的能力深度看的。
他的结论也反潮流——AI 不会消灭专业价值,反而把专业价值的形态变了——
专家对 AI 的使用更难,但收益也更高——前提是会用。专家能看到 slop,但也知道怎么 steer、怎么约束、怎么评估模型。
AI 没有让”专业”变得不重要——它让专业更多地关于方向、判断、和”知道好的样子是什么”。
四、编码现状:agentic coding 是事实标准,但难的还是难
他作为 Linear 的人,看的是真实数据——
跟客户和同行业公司聊下来,agentic coding 现在已经基本上是标准做法。但有一个谱——几乎没有人在私下场合会说他们的 agent 写了 100% 的代码。
我也没听到很多关于真实公司在跑大规模独立 agent 群的真实故事。
工程师还是非常多地参与在 steer 这件事里——一个人最多同时跑几个 agent,加上后台几个 cloud agent 处理小修小补。再多就是 Harrison Bergeron 那种状态——身上各种东西不停 ping 你、把你的思考切碎。
Harrison Bergeron 是 Vonnegut 1961 年的短篇小说,主角脖子上挂着一个发出噪音的装置专门打断他的思考——保证他不会比平均人聪明。
他给的 Linear 内部数据特别有冲击力——
-
• Linear 大多数付费 workspace 现在装了 coding agent -
• agent 活跃度几个月翻了 5 倍以上 -
• 仅仅是 Linear 自家的 cloud coding agent,一个月修 1000+ 个 issue
他对这件事的观察非常清醒——
最大的影响是带宽——能搞定更多以前太琐碎、太烦、太花时间不值得做的事。
但难的问题还是难。Agentic coding 没有像叙事里说的那样让难题加速太多。它在边边角角帮忙——脚手架、重构、调研、小修小补——但难的部分还是要理解系统、做权衡、知道”什么应该存在”。
他的总结一句话——
在专家工作流里,AI 的价值通常不是”AI 写代码、你接受它”——是围绕工作的加速。
探索方案、搭脚手架、debug、重构、写测试或大型迁移、处理小修小补——AI 干这些。 专家提供品味、约束、和最终判断。
我自己用 Claude Code 半年的体验和这个完全一致。它最有用的不是”它替我写完一个功能”,是它让那些“我本来不会去做、因为太烦了”的小修小补变得能做。我项目里那些”什么时候有空再修”的 TODO,现在被 cloud agent 慢慢扫完了。但需要架构判断的那部分?还是只能我做。
五、设计:图像生成在迭代时崩、设计工具应该在生产代码之上吗
他对图像生成的观察很真实——
图像生成的能力变好了很多,但越多迭代它越崩。
让 AI 改某一个特定的东西、按某个特定方式改——很难。它经常一次改了一堆不该改的东西。每次迭代还像是给整张图加了一层 filter——你可能要新开 chat、新描述、新文件,从头再来。
我也希望未来有更好的工具能把 AI 限定在特定区域,而不是每次都重新理解整张图。
这事在我用图像生成的体感里也一样。我从 Midjourney、SDXL、Gemini 一路用过来——所有这些模型都有”你想改一处、它给你改五处”的毛病。
他对”设计工具是否应该直接操作生产代码”的看法也很有洞察——
很多设计 + 代码工具会展示一个 React component(比如一个按钮),让你用设计工具改它。
但当我在设计的时候,我能在脑子里想象按钮怎么工作——它是 vector 还是 React 组件,对我那一刻没有意义。
我做的设计很多不是 production design——不是为了实现最终版本、不是为了测每一个边界。大部分设计工作是关于做决策、理解问题、找契合。这个过程会产生很多杂乱的版本和混乱的想法。
我不希望每一次改动都背着”production code”的速度成本和 token 成本。我也不希望主要通过”文字”或”代码”来设计——设计是视觉领域,对我来说还是 visual canvas tool 最好用。
他向往的是语义化的设计工具——
你画的不是一个矩形,你画的是一个 modal——它继承了系统的某些约定。AI 帮你填屏、生成变体、探索方向。价值在 pattern 上,而不是 pattern 背后必须是真实的 production code。
这一段我特别同意。我用 v0、Magic Patterns 这些设计 + 代码工具的时候,最大的不爽就是”我只是想试一下另一个方向,但每次都触发一次完整的代码生成”。它是浪费、也是注意力的污染——你被代码层的细节拽下来,思考层就掉线了。
六、领域决定一切——AI 公司更像 UNIX,不是 macOS
他说他评估”某公司怎么用 AI”的时候,会先问——
他们是谁、什么领域、什么阶段、什么产品、有客户吗、客户是谁。
不同产品需要不同程度和不同种类的设计——
|
|
|
|
|---|---|---|
| 频繁、触觉性强的工具 |
|
|
| 后端服务 |
|
|
他对当前 AI 公司的判断我觉得有点反共识——
很多 AI 公司更像后端公司——能力是模型,外面的 harness 和 tools 在快速迭代但很多还在幕后。这让他们能跑得很快——因为每个新功能都可以是系统里的一个新 tool,没有太多视觉或概念负担。
这感觉接近经典的 UNIX 系统——程序基于文本、可以独立创造、运行时组合。这种 OS 层的可组合性,比现代 macOS 容易得多。
这件事如果你做后端做久了应该有共鸣——UNIX 的暴力组合性是它穿越几十年技术周期还活着的根本原因。AI 工具圈现在长出来的样子(MCP、tool registries、skill registries、agent harness)确实更像 UNIX,不像 macOS。
我之前几篇 Harness 设计模式[1]、MCP 模式[2]讲的也是同一件事——那是 AI 时代的 UNIX。
收束:「这是它将来最差的样子」这句话我同意,但它没有说服力
他用的反驳特别好——
关于 AI 的最后一个万能论点永远是 “这是它将来最差的样子“。
我同意这一点。但我尽量贴近今天的能力——因为我不知道它将来到底会变成什么。我的”谨慎乐观”就来自这里。当末日论者没价值,做愿景式空想也没价值。
更有用的姿态是——仔细观察、尝试事情、保持判断力不被腐蚀。AI 在改变事情这件事毫无疑问,但我不觉得我们能光靠”信得更狠”就把今天的东西造出来。我们要更现实——注意现在能做什么、决定什么值得做、跟着现实调整。
文末他还引了一句童谣式的话特别戳——
“如果潜力等于收入,那这些 CapEx 早该是利润了。”
这一句是对当下 AI 投资和落地差距最幽默的吐槽。
我自己读完的一点感受
这个时代写得最有价值的 AI 文章,不是预测的、是观察的。
预测会过期。观察不会。
Linear 这位的视角和我这半年用 AI 的真实体感非常一致——AI 真的改变了一些事,但改变的位置和叙事描述的位置差距巨大。
如果让我从这 8 个观察里挑 3 句话带走——
-
1. “造错东西也变得更容易了”(计划那段) -
2. “专家更多关于方向、判断、和知道好的样子是什么”(专家悖论那段) -
3. “我们不能光靠信得更狠就把今天的东西造出来”(结尾)
这三句话挂办公桌前面,比任何一句”AI 改变一切”都有用。
引用链接
[1] Harness 设计模式: https://whatsdot.site/claude-code-12-harness-patterns[2] MCP 模式: https://whatsdot.site/claude-code-12-mcp-patterns
夜雨聆风