AI 半年观察手记:留在乐观和末日论之间-夜雨聆风

AI 半年观察手记:留在乐观和末日论之间

距离上一波模型编码能力的大跳跃，正好六个月。六个月，通常是蜜月期。蜜月期之后，现实开始回来。

这是 Linear 团队前几天发的一篇《Some Notes on AI》——看行文应该是 CEO Karri Saarinen 写的——开头第一句话。

我读完最大的感受是：这是这个月我读到最不”网红”的一篇 AI 文章。它不爆款、不喊话、不站队，就是一个把 AI 用在自己产品里很久的人，坐下来认真把这半年看到的拧巴东西写了出来。

他自己的开场就把站位讲明白了——

我对 AI 偏谨慎乐观。但我尽量活在当下的现实，不是活在某个 AGI 从人类分支出去自立 TechnoCore 的远未来里。

当前市场对 AI 的叙事太简单了，也老实讲挺让我泄气的——对话总是要么乐观要么末日论，没给中间留位置。我对中间那块更感兴趣：什么真的在变、什么有用、什么炒得过头了、什么是真风险、什么我们其实还不懂。

这篇就是中文版+我的读后感。我没逐句翻——他写了 8 个观察，我按对我冲击力的顺序重排了一下。

一、”计划无用，但做计划是必需的”

最近在硅谷创业圈里有种风气——AI 来了，规划过时了。半年甚至季度规划被嘲成”老古董”。

但 Linear 这位的反问很扎心——

我习惯问：这件事/这个决策，没有 AI 的时候到底能不能做？

据我所知，从来没有”必须要做长周期规划”这种硬性要求。常识一直都是”要敏捷”——但还是有大量公司最后做了年度或半年度的规划。

那问题是：为什么？这些规划周期到底解决的是什么问题？AI 真的解决了那个问题吗？

他给出了一个很反潮流的回答：规划其实不是关于”计划”这个产物，是关于”对齐”和”承诺”这件事。

规划逼着整个组织坐到同一张桌子上，辩论什么真的重要、做出优先级、创造意义、再把这个方向同步给所有人。

有时候规划还是在预先消化组织里的复杂度和边界——计划成了一片共享地图，部门之间能在上面对齐导航。计划的真正作用是一个 forcing function——逼着这些会议和讨论必须发生。

这一段我想抄下来贴墙上。

我做产品这几年的体感和他完全一样。一个团队”没有计划”的真实状态，从来不是”敏捷”，而是——

• 没人知道为什么做这个
• 优先级永远在变
• 每次复盘大家在不同的认知频道上
• 重要的事情永远在被紧急的事情挤占

计划解决的不是”输出计划”这件事——是上面这一堆事。

那 AI 改变了什么？他认为——

AI 可能确实改变了时间线和带宽——你能更快做更多东西。但它没解决其他那些问题。选择的需要还在。某种意义上选择会更重要——因为造东西的成本下降了，造错东西也变得更容易了。

这一句”造错东西也变得更容易了”是这一段最锋利的判断。

他对自己团队的实际做法是——6 个月方向 + 周/月级灵活调整。Linear 一直保留”任何月份或周都可以改计划”的能力，但是有一份基础方向。

我自己的判断：很多创业团队现在用 AI 跑得比以前快得多，但跑的方向，我从外面看，挺多是错的。”用 AI 一周做出来”和”用 AI 一周做出一个对的东西”差了十万八千里。

二、你以为你在 steer AI——但 AI 也在 steer 你

这一段是全文我最喜欢的。

他的核心观察——

工具一直在塑造工作流，它一直在给你看路。

AI 工具不一样的地方在于——它是思考工具，不是机械工具。它能塑造你和你的工作的能力，比以前任何工具都强。

vibe coding 这个东西在他看来是“不和 AI 对抗、跟着它的纹理走”——快、有惯性、模型有它的方向、你借力它的方向。

他的结论很务实——

这种工作流有用，但不会精确把你带到你原本想去的地方。是好是坏，取决于场景。

我自己的踩坑记忆——这件事我吃过亏。我有几次”用 Claude Code 写一个 prototype”，最后产出的代码风格、命名、结构、模式，全部是 Claude 喜欢的样子。三个月后我自己回去看那段代码，它感觉不像我写的。这不是 Claude 的错，是我没意识到 vibe coding 的副作用是 vibe 不是我的。

这件事我现在的反应是——只让 AI 做我已经能做的事。需要它”决定方向”的事情我会停下来自己做。

三、专家悖论：你越懂的领域，AI 看着越像在糊弄你

他有一句话我直接抄下来——

AI 通常在你最不懂的领域显得最神。这可能是市场上对 AI 印象不一致的最大根源。

在你深入的领域，你能看到 gap——输出”差不多但不对”，缺上下文、编细节、走最显然的路、需要重 steer 才有用。

在你不太懂的领域，同样质量的输出感觉像魔法——因为你没有判断力去看到它缺了什么。

他用了两个心理学术语——

• Gell-Mann Amnesia（盖尔曼遗忘症）：你读自己专业领域的报道发现错漏百出，但翻到下一页读别的领域的报道时却完全相信
• Dunning-Kruger 效应（达克效应）：知识越浅，自信越高

这两个东西叠加在 AI 上、放大成了行业规模。

这一句话凶。它解释了为什么 X 上”AI 全能改变一切”和”AI 在我的领域全是垃圾”两种叙事永远共存且永远辩不出来——他们说的是同一个 AI，但是从两个不同的能力深度看的。

他的结论也反潮流——AI 不会消灭专业价值，反而把专业价值的形态变了——

专家对 AI 的使用更难，但收益也更高——前提是会用。专家能看到 slop，但也知道怎么 steer、怎么约束、怎么评估模型。

AI 没有让”专业”变得不重要——它让专业更多地关于方向、判断、和”知道好的样子是什么”。

四、编码现状：agentic coding 是事实标准，但难的还是难

他作为 Linear 的人，看的是真实数据——

跟客户和同行业公司聊下来，agentic coding 现在已经基本上是标准做法。但有一个谱——几乎没有人在私下场合会说他们的 agent 写了 100% 的代码。

我也没听到很多关于真实公司在跑大规模独立 agent 群的真实故事。

工程师还是非常多地参与在 steer 这件事里——一个人最多同时跑几个 agent，加上后台几个 cloud agent 处理小修小补。再多就是 Harrison Bergeron 那种状态——身上各种东西不停 ping 你、把你的思考切碎。

Harrison Bergeron 是 Vonnegut 1961 年的短篇小说，主角脖子上挂着一个发出噪音的装置专门打断他的思考——保证他不会比平均人聪明。

他给的 Linear 内部数据特别有冲击力——

• Linear 大多数付费 workspace 现在装了 coding agent
• agent 活跃度几个月翻了 5 倍以上
• 仅仅是 Linear 自家的 cloud coding agent，一个月修 1000+ 个 issue

他对这件事的观察非常清醒——

最大的影响是带宽——能搞定更多以前太琐碎、太烦、太花时间不值得做的事。

但难的问题还是难。Agentic coding 没有像叙事里说的那样让难题加速太多。它在边边角角帮忙——脚手架、重构、调研、小修小补——但难的部分还是要理解系统、做权衡、知道”什么应该存在”。

他的总结一句话——

在专家工作流里，AI 的价值通常不是”AI 写代码、你接受它”——是围绕工作的加速。

探索方案、搭脚手架、debug、重构、写测试或大型迁移、处理小修小补——AI 干这些。 专家提供品味、约束、和最终判断。

我自己用 Claude Code 半年的体验和这个完全一致。它最有用的不是”它替我写完一个功能”，是它让那些“我本来不会去做、因为太烦了”的小修小补变得能做。我项目里那些”什么时候有空再修”的 TODO，现在被 cloud agent 慢慢扫完了。但需要架构判断的那部分？还是只能我做。

五、设计：图像生成在迭代时崩、设计工具应该在生产代码之上吗

他对图像生成的观察很真实——

图像生成的能力变好了很多，但越多迭代它越崩。

让 AI 改某一个特定的东西、按某个特定方式改——很难。它经常一次改了一堆不该改的东西。每次迭代还像是给整张图加了一层 filter——你可能要新开 chat、新描述、新文件，从头再来。

我也希望未来有更好的工具能把 AI 限定在特定区域，而不是每次都重新理解整张图。

这事在我用图像生成的体感里也一样。我从 Midjourney、SDXL、Gemini 一路用过来——所有这些模型都有”你想改一处、它给你改五处”的毛病。

他对”设计工具是否应该直接操作生产代码”的看法也很有洞察——

很多设计 + 代码工具会展示一个 React component（比如一个按钮），让你用设计工具改它。

但当我在设计的时候，我能在脑子里想象按钮怎么工作——它是 vector 还是 React 组件，对我那一刻没有意义。

我做的设计很多不是 production design——不是为了实现最终版本、不是为了测每一个边界。大部分设计工作是关于做决策、理解问题、找契合。这个过程会产生很多杂乱的版本和混乱的想法。

我不希望每一次改动都背着”production code”的速度成本和 token 成本。我也不希望主要通过”文字”或”代码”来设计——设计是视觉领域，对我来说还是 visual canvas tool 最好用。

他向往的是语义化的设计工具——

你画的不是一个矩形，你画的是一个 modal——它继承了系统的某些约定。AI 帮你填屏、生成变体、探索方向。价值在 pattern 上，而不是 pattern 背后必须是真实的 production code。

这一段我特别同意。我用 v0、Magic Patterns 这些设计 + 代码工具的时候，最大的不爽就是”我只是想试一下另一个方向，但每次都触发一次完整的代码生成”。它是浪费、也是注意力的污染——你被代码层的细节拽下来，思考层就掉线了。

六、领域决定一切——AI 公司更像 UNIX，不是 macOS

他说他评估”某公司怎么用 AI”的时候，会先问——

他们是谁、什么领域、什么阶段、什么产品、有客户吗、客户是谁。

不同产品需要不同程度和不同种类的设计——

产品类型	设计要求	例子
频繁、触觉性强的工具	需要大量 UX 打磨——用户每天都摸、小摩擦会复利	Email、聊天、Linear
后端服务	价值主要在后端逻辑——UI 可以更克制甚至更糙也不影响价值	数据库、API 网关、消息队列

他对当前 AI 公司的判断我觉得有点反共识——

很多 AI 公司更像后端公司——能力是模型，外面的 harness 和 tools 在快速迭代但很多还在幕后。这让他们能跑得很快——因为每个新功能都可以是系统里的一个新 tool，没有太多视觉或概念负担。

这感觉接近经典的 UNIX 系统——程序基于文本、可以独立创造、运行时组合。这种 OS 层的可组合性，比现代 macOS 容易得多。

这件事如果你做后端做久了应该有共鸣——UNIX 的暴力组合性是它穿越几十年技术周期还活着的根本原因。AI 工具圈现在长出来的样子（MCP、tool registries、skill registries、agent harness）确实更像 UNIX，不像 macOS。

我之前几篇 Harness 设计模式^[1]、MCP 模式^[2]讲的也是同一件事——那是 AI 时代的 UNIX。

收束：「这是它将来最差的样子」这句话我同意，但它没有说服力

他用的反驳特别好——

关于 AI 的最后一个万能论点永远是 “这是它将来最差的样子“。

我同意这一点。但我尽量贴近今天的能力——因为我不知道它将来到底会变成什么。我的”谨慎乐观”就来自这里。当末日论者没价值，做愿景式空想也没价值。

更有用的姿态是——仔细观察、尝试事情、保持判断力不被腐蚀。AI 在改变事情这件事毫无疑问，但我不觉得我们能光靠”信得更狠”就把今天的东西造出来。我们要更现实——注意现在能做什么、决定什么值得做、跟着现实调整。

文末他还引了一句童谣式的话特别戳——

“如果潜力等于收入，那这些 CapEx 早该是利润了。”

这一句是对当下 AI 投资和落地差距最幽默的吐槽。

我自己读完的一点感受

这个时代写得最有价值的 AI 文章，不是预测的、是观察的。

预测会过期。观察不会。

Linear 这位的视角和我这半年用 AI 的真实体感非常一致——AI 真的改变了一些事，但改变的位置和叙事描述的位置差距巨大。

如果让我从这 8 个观察里挑 3 句话带走——

1. “造错东西也变得更容易了”（计划那段）
2. “专家更多关于方向、判断、和知道好的样子是什么”（专家悖论那段）
3. “我们不能光靠信得更狠就把今天的东西造出来”（结尾）

这三句话挂办公桌前面，比任何一句”AI 改变一切”都有用。

引用链接

[1] Harness 设计模式: https://whatsdot.site/claude-code-12-harness-patterns[2] MCP 模式: https://whatsdot.site/claude-code-12-mcp-patterns