乐于分享
好东西不私藏

谨慎乐观|AI不是万能神,也不是无用功(Linear高管谈AI真相)

谨慎乐观|AI不是万能神,也不是无用功(Linear高管谈AI真相)

作者: Karri Saarinen  译者:Chris 陈


距离上次模型编程能力的重大飞跃,我们已经接近六个月的节点。六个月往往是一段蜜月期。过了这段时间,一些现实开始浮现。

我对 AI 倾向于谨慎乐观。大多数时候,我努力活在当下——不是活在某个遥远的未来,在那里 AGI 脱离人类,形成自己的”技术核心”社会。

能力是真实的,但限制也是真实的。有趣的问题不在于”这一切将走向何方?”,而在于“现在到底有什么不同?

我发现当前围绕 AI 的市场叙事过于简单化了,说实话,有些令人沮丧。对话中往往在乐观主义和末日论之间不留任何中间地带。

我更感兴趣的是中间地带:什么真正在改变、什么有用、什么被过度炒作、什么蕴含真正的风险,以及我们仍然不理解什么。


计划本身毫无价值,但制定计划的过程却是一切

最近,似乎”规划”正在变得过时。

我通常思考 AI 影响的方式是:同一个决策或活动,在没有 AI 之前是否也能做出。 据我所知,从来没有人硬性要求必须进行长期规划周期。如果说有什么共识的话,那一直是应该更敏捷,然而许多公司最终还是形成了年度或半年度规划周期。

所以问题是:为什么?那些规划周期解决的是什么问题,而 AI 是否真的解决了那个问题?

我没有完整的答案,但我常常认为,规划的意义不在于产出(即计划本身),而在于对齐(alignment)和承诺(commitment)的演练。它迫使组织聚在一起,辩论什么才是真正重要的,确定优先级,创造意义,然后将这个方向分享给所有人。

有时它也是为了预先处理组织复杂性或边界问题,而计划则创造了各部门可以共同导航的共享地形。计划实际上只是所有这些会议和讨论得以发生的强制函数(forcing function)

因此,虽然 AI 可能会改变时间线、增加带宽,但我还不太清楚它如何解决组织原本就在解决的其他问题。选择的需求依然存在。 在某种程度上,随着构建成本的下降,这些选择可能变得更加重要。如果制造更多东西变得更容易,那么制造错误的东西也变得更容易。

这种转变确实有一定道理。能力在快速变化,市场偏好在波动。非常长的规划周期现在承载了更多风险,因为在你完成计划之前,市场可能已经变了。

也有明确的理由支持更多实验。AI 能力持续提升,而我们对其使用方法的理解仍然不完整。有价值的用例、工具和工作流往往需要从尝试中涌现,它们不可能总是被预先规划出来。

这就是我们从一开始在 Linear 运作的方式。我们至少有六个月的计划,设定总体方向。但我们保留每月或每周改变计划或优先级的能力。计划始终是我们认为值得做的事情的一种信念。随着我们学习或注意到变化,我们会调整它。我们现在也在鼓励更多实验——更多空间去发现涌现的用例,而不仅仅依赖计划。

但没有计划、没有规划、没有方向,或者只有非常短的路线图,也可能让组织失去舵手。 风险在于为错误的客户、错误的原因构建错误的东西。

没有思考、方向或关于你真正想要实现什么的计划,你可能会最终去做任何容易做到的事情。

当你不做规划演练时,你也永远不会在思考、承诺、计划或时间线上失败,因为你从未做出过它们。你可以随便构建什么,然后看看接下来会发生什么,并可能让 AI 引导你走向最容易的而非最重要的方向。


你引导 AI,AI 也引导你

这触及了我之前写过的一点:工具总是在引导和影响工作流。它们总是在为你指明道路。

AI 工具不同之处在于,它们是思维工具,而不仅仅是机械工具。它们引导你和你的工作的能力比以往更强。

有一种有效的工作流是:你不与 AI 对抗,而是让它拉着你走。这本质上就是氛围编程(vibe coding)做得好时的样子:顺着工具的纹理走,快速移动,接受模型有自己的方向,并利用这种动量。

这可能有用,即使它不会把你带到你确切想去的地方。那是否好,取决于具体情况。


专业知识的悖论

AI 在你了解最少的领域往往最令人印象深刻——我认为这是市场认知失调的最大来源。对于普通观察者来说,AI 的能力被描述和理解成无限的。

在你深入理解的领域,你会看到差距。 输出接近但不完全对。它遗漏了上下文,编造了细节,选择了显而易见的道路,或者需要大量引导才能变得有用。

在你了解较少的领域,同样的输出可能感觉像魔法,因为你缺乏判断力去看到缺失了什么。这是一种大规模的古尔曼失忆症(Gell-Mann Amnesia)和邓宁-克鲁格效应(Dunning-Kruger effect)

悖论在于:专业知识让 AI 更难使用,但如果你知道如何正确使用,它也更有价值。 专家能看到”垃圾(slop)”,但他们也知道如何引导、约束和评估模型。

所以 AI 并没有消除专业知识的价值。它让专业知识更多地体现在方向、判断力,以及知道”好”是什么样子


编程

与行业内客户和公司交流后,很明显 智能体编程(agentic coding)现在已相当普遍。但存在一个光谱。几乎没有人私下说他们的智能体写了 100% 的代码。我也很少听到真实公司运行大规模独立智能体集群的真实故事。

工程师仍然深度参与引导智能体,通常可能一次只能运行几个智能体,外加少数云端智能体在后台处理更琐碎的修复。再多的话,你就生活在《哈里森·伯杰龙》的世界里了——总有东西不断 ping 你,打断你的思考过程。

我们在 Linear 也看到了这一点。我们大多数付费工作空间现在都已安装了编程智能体,使用这些智能体的活动量在几个月内增长了超过 5 倍。我不确切知道每家公司内部如何使用云端智能体,但方向很明确:这些工具已经成为正常开发工作流的一部分。

在 Linear,工程师使用各种智能体,我们也看到了节奏的提升。仅使用我们自己的云端编程智能体,我们现在每月修复超过 1,000 个问题,而且还在快速增长。我看到最大的影响是带宽的增加。我们现在可以处理比以前更多的小问题。那些可能太小、太烦人或太耗时的任务,现在变得更容易完成了。

但难题仍然是难题。 智能体编程并没有像叙事经常暗示的那样大幅加速难题的解决。它在边缘有帮助——脚手架搭建、重构、调查和小型修复。但困难的部分仍然需要理解系统、做出权衡,以及知道应该存在什么。

在专家编程工作流中,价值通常不是”AI 写代码,你接受”。价值在于围绕工作的加速。它可以探索方案、搭建实现脚手架、调试错误、重构代码、编写测试或大规模迁移,以及处理小型修复。

专家仍然提供品味(taste)、约束和最终判断


设计

新的图像生成和设计能力好多了,但我仍然觉得它们很有挑战性。

图像生成似乎在迭代越多时越容易崩溃。很难让 AI 以一种特定的方式改变一个特定的东西。它往往会同时改变很多东西。每次迭代似乎也都会给整张图片加上某种滤镜,你可能不得不重新开始一个新的对话,用新的描述和新的文件来修复它。

我希望看到更好的工具来将 AI 限制在特定区域,而不是让它每次都重新解释整个输出。这在写作中也会发生——要求一个改变往往会导致模型重塑整篇文章。我希望图像生成能有更好的控制和工作流。


设计与代码

我一直在思考让设计工具直接操作生产代码库的价值。

许多设计+代码工具展示一个 React 组件(比如一个按钮),然后让你用设计工具修改它。

但当我设计时,我能想象按钮如何工作。它是矢量图形还是 React 按钮,在这个阶段对我来说几乎无关紧要。

我做的很多设计工作不是生产设计。 我不是在尝试实现最终版本或测试每个边界情况。大多数设计工作是关于做决策、理解问题、找到契合点。这个过程会产生许多变体和凌乱的想法。

我不希望每次改变都带有生产代码的速度或 token 成本。我不想因为提示词没完成就陷入错误。我也不想主要通过文字或代码来设计。设计是一个视觉领域,对我来说,它仍然最好在视觉化、基于画布的工具中工作。

如果我们暂时搁置”UI 是否还需要”的争论。设计仍然是塑造问题和解决方案的一种方式。大多数设计工作是关于理解一个功能如何融入现有系统、它如何与其他概念交互、它的边界是什么、它为什么优化。

即使一个产品通过 MCP、CLI 或 API 使用,概念和工作流仍然需要以某种方式说得通。

我觉得更有用的是高级视觉工具,或语义化 UI 设计工具,在那里你可以更直接地定义布局和模式。你不是在画一个矩形,而是在画一个模态框(modal),它可以继承系统的一些方面。AI 可以帮助填充屏幕、生成变体、探索方向。价值在于模式本身,而不在于这些模式由真实的生产代码支撑。

然后,一旦我有了真正想要进行实时原型验证的东西,应该有一个清晰的工作流来提炼设计文件,并将其翻译为代码。

在 AI 世界中,设计对我来说就像规划。它是你大脑在运行的 /gstack,问你问题,但在屏幕上找到解决方案。


领域很重要

对于几乎任何关于一家公司如何使用 AI 的说法,我都会尝试问:他们是谁?他们的领域是什么?他们处于什么阶段?他们的产品是什么?他们有客户吗?客户是谁?

我一直以来的思考方式是,每个产品需要不同程度的稳定性、信任、安全性,甚至像产品设计这样的东西——每个产品需要不同层次和类型的设计。

一个频繁使用的、有触感的工具(如电子邮件)需要大量的 UX 打磨,因为用户能感受到每一个小摩擦。他们经常使用它,小的摩擦会累积。

后端服务则不同。价值可能在后端逻辑中。UI 可以更有限,甚至更粗糙,产品仍然有价值。

我认为许多 AI 公司更像后端公司运作。能力就是模型。工具和框架在其之上迭代,但到目前为止,它们往往是在幕后。这帮助它们快速移动,因为每个功能都可以是系统中的另一个工具,而不需要太多视觉或概念上的足迹。

它感觉更接近经典的 UNIX 系统,在那里程序是基于文本的,可以独立创建并在运行时组合。操作系统的可组合性比现代 macOS 之类的东西更容易。


最后的论点总是”这些工具已经是最差的状态了,只会越来越好”。

我同意,但我努力贴近当下的能力,因为我不知道它们确切会变成什么。这就是我谨慎乐观的来源。我不认为做一个末日论者有多大价值,但我也认为一厢情愿的想法没有太大价值。

更有用的立场是:仔细观察、尝试事物、保持判断力完整。 AI 显然在改变事物,但我不认为我们今天可以仅仅通过更坚定的信念来构建。我们需要更真实,注意现在什么是可能的,决定什么是值得做的,并随着现实的变化而调整。

就像古老的童谣所说:如果潜力就是收入,所有这些资本支出(CapEx)早就已经是利润了。