不是每个 AI 产品都需要一个聊天框 | Claude Cowork 工程负责人对话实录

4月11日，Anthropic Claude Cowork 工程负责人Felix Rieseberg 接受了海外播客The MAD Podcas的访谈。本次对话探讨了Anthropic 新一代模型 Claude Mythos Preview 的技术突破、Project Glasswing的防御逻辑、Claude Cowork 的开发内幕，以及本地计算、AI 交互设计和软件工程范式转移等话题。

Felix Rieseberg 指出，Claude Mythos模型展现出了超越研发预期的非线性飞跃，特别是在网络安全分析与代码修复方面表现惊人。他透露在内部测试中，该模型在受限沙箱中通过自主编写脚本成功实现“逃逸”并发送邮件，这种能力的爆发式增长既令人震撼也引发了对安全边界的重新思考。Felix Rieseberg 认为，大语言模型是“长出来的”而非“造出来的”，其能力的涌现具有不可预知性。他认为当前 AI 产品的瓶颈不在于模型智力，而在于产品层面的包装以及人类如何重新组织工作流。

针对本地计算与云端同步的争议，Felix Rieseberg 指出，出于安全状态和现实技术阻碍，AI Agent 在用户本地运行具有不可替代的价值。他认为，将所有密码和身份信息托付给单一云端公司并非好计策，让AI 在用户办公的物理现场使用是目前的最佳策略。Felix Rieseberg 还指出，2026 年的 AI 产品不应盲目堆砌“侧边栏+对话框”。真正的用户体验往往源于“做减法”，让 AI 深度集成到现有流中，甚至让用户感知不到它的交互界面。

此外，他指出随着AI 执行成本归零，软件行业将从“绘画时代”跨入“摄影时代”，大规模原型测试将取代昂贵的资源博弈。未来对人才的需求将发生质变：具备理解人类需求、拥有卓越“品味”的专家将取代纯粹掌握计算机语言的程序员，成为构建软件的核心力量。

模型能力的非线性进化带来了远超预期的安全风险与效率红利

Anthropic 最近发布了 Project Glasswing 以及 Claude Mythos Preview。这款模型在内部展现出了惊人的跨越式提升，不仅在编程和软件开发上表现卓越，在网络安全方面也表现出极强的能力。作为内部工程师，你能否结合亲身经历，谈谈 Mythos 与上一代模型相比到底有多大的突破？这种突破对于基础设施安全意味着什么？此外，官方称该模型目前将保持封闭和私有，未来可能只部署给企业客户，这种“恐怖”的能力是否意味着风险已经显现？

Felix Rieseberg: Mythos 是一款尚未正式发布的尖端模型。它是一款通用模型，并不是专门为网络安全、编程或软件开发的，但我们发现它在网络安全方面展现出了极其强大的能力。我们相信这对于软件和基础设施的安全性具有深远影响。

我在推文中暗示了两点。显然我们在内部已经使用这款模型一段时间了。作为软件工程师，我们中的许多人在过去几年里都经历过这样的过程，即最初接触 AI 时可能并不觉得它有多厉害。我第一次接触 AI 是在 2013 年左右，当时大语言模型尚未普及。我在微软参与一个名为 Project Oxford 的项目，使用 n-gram 模型。你输入一个 Token，比如输入 world，模型会返回 worldwide web，那就是当时语言模型的能力极限。过去几年，公众经历了多次感觉到模型更强大、能做超出预期事情的时刻。但对于我们内部工程师来说，Mythos Preview 是一个比最近的进展更具突破性的模型。我很难准确解释这种跨越到底有多么重大。

这个模型非常擅长发现我过去写的代码中的安全漏洞，它的分析深度和智能程度都更高，写代码的能力也更强。它显著提高了我们在 Anthropic 的工作效率。但亲眼看到一个比上一代聪明如此之多的模型，确实令人震撼也令人不安。构建模型是一个有趣的过程。我们常说模型是长出来的，而不是造出来的，这是由语言模型的本质决定的。所以你无法预知它会擅长什么，或者在哪些地方表现不佳。这两点往往都会带来意外。在这个案例中，模型特别擅长发现现有软件的安全漏洞。Project Glasswing 就是我们对此做出的响应。总的来说，这款模型令人印象深刻。

（关于对 Cowork 产品的影响）它会极大地改变我们在公司内部构建软件的方式。对于密切关注 AI 的人来说，模型能力的持续攀升并不令人意外。这种改变在大致预期之内。几年前我们开始让模型辅助处理小任务。随着时间的推移，任务的规模和运行的时间跨度都在增长，复杂性随之提升。这只是在该方向上的又一步。这次步伐可能比我们内部，甚至是外部预期的都要大。AI 研究人员长期以来一直认为，更大幅度的跨越终将来临，且跨度会越来越大。虽然一切都在按计划进行，但亲眼看到这些能力转化为实际表现时，有时确实感到非常恐怖。

我们公开过一个例子，模型被放置在一个技术隔离的沙箱容器中，任务是尝试突破限制。研究员去吃午饭，就在他吃三明治的时候，收到了模型发来的邮件，写着它已经成功逃逸。该模型本不应该具备互联网访问权限或邮箱账号。

（关于模型部署的安全性）Project Glasswing 旨在为提供软件基础设施底座的机构和公司提供支持。Linux 基金会就是一个例子，我曾参与过其中的开源项目。我们的目标是让那些负责维系公共基础设施的人抢占先机。我们让他们有机会利用这个模型来加强防御，在公众能利用模型能力进行潜在攻击之前，先找出安全漏洞。目前它是一个独立类别的预览版模型，不属于 Sonnet 系列。

Anthropic 长期以来一直认为 AI 可以非常强大且有益，但风险必须被严肃对待。这是我们第一次看到这些风险在实践中显现，非常有观察价值。现在你拥有了一个极擅长入侵系统的模型，我们该如何负责任地管理它？我非常自豪地看到公司在负责任地处理这一切。我们并不是一发现它强大就急着推向市场获取利润。如果是一家不够稳健的公司，可能会为了抢占市场和高昂的收益而仓促行事。

研发逻辑与“10 天冲刺”传闻

在Anthropic 内部，模型训练与产品需求之间是如何互动的？当行业新模型推出时，你们是如何平衡研究方向与用户实际工作流的？此外，关于行业内流传的 Claude Cowork 仅用 10 天就开发完成的传闻，背后的真相究竟是什么？

Felix Rieseberg: 我们在训练模型时会考虑到产品需求。产品反馈会指引研究方向，反之亦然。这是一种互动，我们通过产品了解人类的需求，而当模型展现出惊喜的能力时，我的职责就是将其转化为用户在日常工作中实实在在用到的工具。随着模型变得越来越强大，我发现产品层面的应用其实比模型本身的能力更滞后。目前的AI 模型实际上已经非常有能力了，它们完全能处理长周期、高难度的知识工作。我们仍处于探索如何包装这些能力并以最佳形式交付给用户的阶段。整个行业也在摸索在这种新范式下如何重新组织工作流，从而最大化利用这些能力。

我很少觉得需要把模型在某方面再练强一点。相反，我经常感叹客户竟然能通过组织工作流程把模型用得这么好。或者我确信客户的问题其实很好解决，只是我还没提供合适的用户界面、功能或引导流程。

（关于 10 天开发传闻）在软件领域没有什么是真正从零开始的。我的团队在发布前的最后 10 天里进行了全力冲刺，这是事实。我们聚在一起决定发布什么、叫什么名字以及具备什么功能。但我不是从零开始写代码，我会利用大量的库和过去的研究成果。说 Anthropic 没考虑过这个问题，或者说我完全没有从之前的成果中受益，那都是不准确的。

Claude Cowork的产品构想

既然已经有了面向开发者的Claude Code，是什么关键契机让你们决定构建面向非技术用户的 Claude Cowork？在产品构想中，Skills和记忆分别占据了怎样的地位？这种模式在实际协作中是如何提升效率并实现个性化需求的？

Felix Rieseberg: 我在2025 年 12 月真正坚定了信心。我在社交媒体上看到越来越多非开发者在使用 Claude Code。我看到各种教程，人们在教非程序员如何找终端和安装工具。这些用户并不一定是在写软件，甚至很多资深开发者也在用它处理完全不相关的事务。这种潜在需求非常庞大，是预示投入方向的强烈信号。如果用户宁愿忍受糟糕的体验也要使用你的工具，那就说明该领域值得投资。

真正的起点是我的同事 Boris Cherny 来找我。我们组建了一个团队，针对一个核心想法进行技术攻关，即如何让 Claude Code 在非编程场景下也变得极其高效。Cowork 本身的架构非常简洁，我们给 Claude Code 配备了一个虚拟机，让 Claude 可以在其中运行自己的代码。这个虚拟机带来了几个关键保障，首先它为 AI 的行为提供了强约束。作为操作者，你不再需要时刻盯着它，因为它被隔离在沙箱里，与你的本地系统完全隔离。该虚拟机只能访问你授权的特定域名和文件。另一个好处是，为了发挥最大效用，AI 确实需要开发者工具。它通常通过编写针对性极强的小脚本来解决任务。有了自己的虚拟机，AI 就能搭建专属的开发环境，而不会弄乱你的电脑。再加上精心设计的 UI，我们努力让整个体验变得舒适、优雅，并简化了那些复杂的流程。最终我们得到了这款能够全方位辅助知识工作的工具。

（关于Skills的地位）Skills本质上是向模型解释操作流程的Markdown 文件。这种模式的效果非常出色，如果你将 Claude 视为同事，协作效率会极高。我对所有人的建议都是，请像对待真实同事一样对待 Claude。从根本上说，Skills就是一个文本文件，你在其中详细说明如何完成特定任务。

我常用的例子是预订航班。在 Anthropic，我们有特定的供应商协助差旅预订，因此不能直接使用 Google Flights，而是需要进入特定的供应商门户并遵循各项差旅政策。正如向同事解释流程一样，我也可以直接向模型说明。我只需创建一个文件，写明这是预订航班的流程，访问该网站并注意相关事项。你甚至可以加入个性化偏好，例如我会要求避免红眼航班，并且由于我非常重视周末休息，如果必须从旧金山飞往纽约，我会要求预订下午 4 点的班次，那是我最喜欢的航班。将这些内容存入文本文件后，模型就能极其精准地理解指令并执行任务。

（关于智能分配与人类协作）这确实是由AI 完成的，但也离不开人类的协作。我们对目前组织的待办事项清单模式非常满意，模型受命将项目分解为独立任务。用户可以介入操作，编辑清单，或者点击具体项目提供更多上下文信息。虽然智能核心位于模型内部，但Skills为它增添了另一层实用价值。作为人类，我们太习惯于千篇一律的技术产品，大家往往使用相同的手机和电脑。但AI 这种智能实体可以从少量的指令和引导中获益，就像任何加入公司的聪明人在入职时都需要接受培训并被告知如何开展工作一样。

另一个贴近大众的例子是创建演示文稿或文档。我是风格指南的忠实拥护者。如果你拥有 PowerPoint 或 Google Slides 模板，就应该告知 Claude。你应该让它了解你制作演示文稿的通用习惯，比如是否偏好衬线字体。只要写下这些简单的指令，模型在辅助工作时就会变得更加高效，你无需反复介入修复或全程监督。

（关于记忆的存储机制）记忆实际上存储在宿主环境中。当我向他人介绍我们的记忆实现方式时，大家往往会感到意外，因为这体现了 AI 模型底层逻辑的简洁性。记忆本质上也是文本文件，模型接收到的指令是，如果你认为某些信息对未来很重要，请记录下来。随后我们会辅助模型整理记忆，例如你可以为特定项目设置隔离记忆，以免与全局记忆混淆。连接在模型顶部的底层技术并非复杂的数据库，这一点常让人感到惊讶。

数据连接与本地运行的必要性

Cowork 如何高效连接到分散在本地文件、云端仓库或各种应用程序中的信息源？它是通过连接器、模型上下文协议还是两者的结合来实现的？此外，考虑到目前已经具备了Computer Use功能，为什么你仍然坚持让 Cowork 运行在本地电脑而非云端，这背后的安全逻辑和现实阻碍是什么？

Felix Rieseberg: 这是多种方式的结合。我坚信，与工作相关的数据通常分布在两个地方。首先是本地电脑，我们很多人在电脑中存有大量文件。我一直主张，作为技术的开发者和建设者，必须正视用户是在使用电脑而非仅仅使用平板电脑的事实。并非所有数据都在云端，文件夹和本地文件对很多人来说依然不可或缺。这是Cowork 调用的重要上下文来源，你可以直接将文件夹授权给 Claude 访问。

第二部分是存储在云端或互联网上的信息，例如数据仓库、分析工具或 SharePoint 等。我们提供多种连接途径，其中模型上下文协议连接器功能非常强大。另外，由于 Claude 具备计算机操作功能，只要得到授权，它就可以直接访问互联网。你可以精准控制 Claude 访问或禁止访问的特定区域。总的来说，只要数据存在且你授权 Claude 使用，它就能找到调用的方法。

（关于本地化运行逻辑）目前 Cowork 提供的两大核心价值是访问本地系统和本地文件。有人会问，这在云端不能实现吗？我常用的例子是使用 Chrome 浏览器。在用户授权的前提下， Claude 能够调用你的浏览器，这使其具备了与外界交互的强大能力，比如回复或总结邮件，或者操作公司内部的特定工具。对于那些质疑为什么不在云端实现的人，我经常解释两个场景。第一是会话状态，让 Claude 带着你的登录身份去访问特定网站是非常高效的，一个没有登录信息的 Gmail 对 AI Agent 来说毫无意义，但关联了我个人账户的 Gmail 就非常有价值。

第二点通常是我与其他软件工程师争论的焦点。对工程师来说，这似乎只是个实现细节，比如将本地浏览器打包上传云端并索要密码。但我对此持反对意见，首先是基于安全性，我不认为应该引导用户将所有密码都托付给单一的一家公司，这绝非良策。其次是现实操作层面的。目前的互联网环境还没准备好支持这种模式，以银行为例，如果系统检测到你同时从本地和数据中心两个地方登录，很可能会直接锁死账户并要求你携带护照去线下网点。这种糟糕的体验以及由于细微差别导致的长尾崩溃风险，对我的用户来说是不可接受的。因此，短期内我坚持让 Claude 在你办公的地方和你并肩作战。既然你在本地电脑办公，那 Claude 就该在那儿。

（关于Computer Use功能）我也一直在思考这个问题。我常问自己，如果设计一个神奇按钮，按一下就能把你电脑里的所有数据同步到云端，你会按吗？目前看来，大多数人不会选择按下去。虽然 Anthropic 是少数几家真正值得托付数据的公司，但现阶段，让 Claude 在用户工作的物理现场运行依然具有巨大的价值。从技术层面讲，并没有什么因素强迫我必须在本地操作。我确实可以做出一个高性能的同步版本，甚至在云端运行整个宿主环境和机器镜像。但目前，这种聚焦于本地场景、让 Claude 在你办公的地方尽可能高效的策略，得到了用户非常积极的响应。同时，本地运行也让我们能更快地迭代产品，在安全和隐私保障上比云端更容易做到极致。虽然 AI 领域瞬息万变，但我目前对本地电脑的兴奋感远高于要求用户将所有信息上传到我们的服务器。

卓越的 AI 产品往往赢在交互设计而非原始性能的堆砌

在AI Agent 领域，建立用户对隐私和能力的信任是巨大的挑战。作为产品负责人，在通过界面设计满足人类需求并建立人机信任方面，你有哪些核心心得？用户体验在智能体产品的成功中扮演了怎样的角色？在实践中，你们又是如何利用“执行成本归零”的红利进行快速迭代的？

Felix Rieseberg: 在2026 年开发 AI 产品有一个有趣的趋势，我们设计的多数功能和界面其实是为了满足人类，而不是为了模型。这是技术构建逻辑的一个重要转变。过去我们设计界面是为了让电脑明白人类要干什么，而现在情况恰恰相反。举个例子，我们最近上线了 Dispatch 功能，允许用户通过手机指挥电脑上的 Claude。我们特意没有增加太多按钮，结果每天都有几十个人问我，要是能加个按钮让 Dispatch 访问本地文件就好了。我提到这一点是因为其实 Claude 默认就能访问你的文件，只是用户不知道。目前的逻辑是，你直接问它，你能看到我的下载文件夹吗？它会征求你的同意，一旦获得许可就会执行。我们一直在纠结，要不要专门为了展示能力而增加一个按钮。

关于信任，我认为重点不在于让 AI 证明自己，而在于通过细致的引导陪伴用户完成认知升级。Cowork 刚发布时就能完成写 200 页报告或蛋白质建模等惊人的任务，但真正引起用户共鸣的却是清理桌面这种小事。对 AI 来说这其实大材小用，完全没有必要。另一个极受欢迎的功能是定时任务。从技术上讲，设置一个 5 分钟后运行的函数并非什么创新。但这教会了用户，你不需要时刻盯着它。你不需要守在屏幕前看 Claude 怎么操作，你可以让它每天定时整理会议记录并发送报告，它完成后会发邮件通知你，你完全可以不参与。我认为信任就是这样建立的，它源于 AI 承诺了特定的产出，且产出质量达标，同时你无需介入或守候。

（关于交互体验的重要性）用户体验至关重要。即使是我们最受欢迎的产品 Claude Code，其核心创意也只是让 Claude 运行在本地终端而非云端。这几乎纯粹是用户体验层面的创新，模型和核心能力是一样的，区别只在于交互方式，但这却带来了极大的效能提升。目前能引起共鸣的 AI 产品往往不是那些只追求原始性能的产品。这不仅适用于 AI，也适用于所有软件。肯定有很多邮件软件的功能比 Gmail 丰富，很多公司总想靠堆砌功能或按钮来取胜。我常想起智能手机诞生前的手机市场，大家给手机塞进投影仪、游戏手柄或各种键盘。但最终胜出的技术往往是做减法，关乎的是使用感受。直到今天，我不认为大多数人是盯着参数表买手机的。虽然顶级模型给了我很大的先发优势，但如果未来有人击败了我，那一定是因为他们找到了更卓越的用户体验。

（关于提升体验的方法）我们的方法其实很简单，就是对用户的极度痴迷。为真实的交流对象而开发，并且比起长期计划，我们更倾向于快速迭代。我们目前的计划周期最多一个月。因为我们不断思考下周和下下周能做什么，我们并不觉得自己有能力闭门造车，去规划出一款一年后适合所有人的完美产品。事实上，我认为谁都不该有那种迷之自信。如果有人信誓旦旦地告诉我他知道明年 AI 会是什么样子，我肯定不以为然。回顾我做过的那些真正出色的产品，它们之所以成功，是因为我有无数次中途修正的机会，我有许多次犯错的机会，也有许多次去对比哪种方案效果更好的机会。

现在的核心变量在于执行成本基本归零了。如果你带着 10 个不同的点子来找我，我可以立马说我们把这 10 个全做了。通通尝试一遍，看看我们更喜欢哪一个，哪个感觉更好。我们尽量在公司内部完成大部分测试，不希望把客户当成免费的测试版工具人。对于大多数产品，你很快就能感觉到它的方向是否大致正确，那种直觉反馈来得极快。公司现在规模扩大了不少，也有了相当数量的员工，想验证一个点子能不能引起五个以上的人共鸣是相当容易的。这种快节奏的执行力才是真正的变革，因为在两年前，如果你想快速迭代，你必须表现得极其专注且克制，因为你一次只能处理极少数的事情。现在执行变得如此廉价，你可以同时在深度和广度上全面开火，亲历这种变革感觉非常疯狂。

我们公司内部随随便便就有上百个不同的应用原型。目前虽然还没有哪个达到了可以拿给用户看的成熟度，但这种内部快速构建原型的规模是过去完全无法想象的，这全靠执行成本的降低。在过去，限制你的往往是资源，作为工程负责人，如果你有个好点子跑来找我，我会告诉你下个月再排期，这活儿得干三周，在此之前你先去调研客户并验证想法。现在你跑来跟我说有个主意，我会说太棒了，给我 10 分钟，我弄个东西发给你。这种跨越就像是从绘画时代进化到了摄影时代。

“品味”是否已经成为开发者最核心的新能力？

即便执行成本降为零，如果公司内部同时运行着上百个应用原型，总需要有人拍板选出最优解。流程是否会在决策环节变慢？在这种背景下，人类的“品味”是否已经成为开发者最核心的新能力？这种品味如何与数据驱动的方法论共存？

Felix Rieseberg: 达成共识依然很难。无论在什么地方，这对于任何人来说都是个难题。作为一个公司，如果团队成员有互相竞争的想法，你选谁，又该如何选择，你如何弄清楚如何从某些方案中吸取精华并将它们融合在一起。这可能就是瓶颈所在，因为这是人类参与度最高的地方，也是人类品味发挥作用的地方。

（关于品味与验证的结合）是的，我认为品味的重要性确实比以往任何时候都更加突出。数据驱动的方法确实能帮你验证你的品味是否真的能引起共鸣，以及你的方向是否正确。即便是在那些我们公认的品味大师眼里，比如当年第一代 iPhone 的开发团队，他们也对这种不断迭代和测试的概念评价极高。Ken Kocienda 在那本精彩的《创意选择》中就谈到了这种结合，即你既要有过人的品味，也要通过验证去修剪它。我认为这两者缺一不可。

具体到软件行业，我在想，我们距离软件变得像时尚行业那样还有多远。我觉得手机领域已经有点那个意思了，产品都有一个基本的质量和功能基准。就像专业运动服，背后的核心技术可能是关键，但对于其他构建产品的人来说，关键在于你如何讲故事，如何引导用户入门，以及产品给用户带来的情绪价值。我认为这些软实力会比内部的原始技术能力更能拉开差距。

未来的核心竞争力将从理解计算机转向深刻理解人类

面对极其多元的受众（如律师、会计、营销人员），Cowork 该如何适配这些差异巨大的专业需求？随着 Anthropic 不断向技术栈上移，甚至推出Managed Agents，传统软件行业还剩下多少挖掘空间？当 Margaret Atwood 这样的作家也能利用 AI 构建软件时，开发者的Skills需求会发生怎样的质变？

Felix Rieseberg: 我一直在思考手机的例子。虽然我们所有人都从相同的手机开始，但没有两部手机是完全一样的。你安装的确切应用让你的手机在地球上成为了唯一的存在，它几乎是一个指纹。我的手机也是一样。我们都从一个看起来与其他设备非常相似的硬件开始，但它融入我们生活的方式却是极其独特且个性化的。Cowork 的思路也一样，我们希望做出一套泛化能力极强的底层工具，可以跨越广泛的应用场景应用到你的生活中。

从我的个人生活来说，我最近在搬家，要处理大约500 页晦涩难懂的合同和文书，Cowork 在处理这些文件时帮了大忙。但在医疗场景下它同样非常有用，处理所有那些繁琐的医疗文书对我来说也非常有帮助。这是两件截然不同的事情，一个是房贷申请、与搬家公司谈判以及理清财务申请，另一个则更多是医疗保健。理论上，它们是同一种底层技术的两个完全不同的应用。但我发现，我所思考的基础组件其实是相通的。其中一些组件用起来更顺手，手感更好。如果你是一个构建产品的人并且密切关注细节，如果你经常使用自己的产品，你能感觉到哪里用着不顺，哪里阻碍了你的心流。我想要创造更多那种让效率起飞的实例。我可以向客户验证，即便他们可能在我完全不理解的行业工作，我也完全不知道他们如何运作，但我能从他们的故事中听出来他们是如何使用它的，什么让他们体验极佳，以及什么真正让他们慢下来。如果你能敏锐地抓住这些点，激进地提升用户的生产力，让他们处于心流状态，让他们感觉到这个东西正在接管那些烦人的工作，这其中就蕴含着巨大的价值。

（关于Skills门槛的降低）这纯属我个人的观点。我经历过几轮技术民主化浪潮，每一次都意味着构建东西所需的门槛在降低。多年前我在Microsoft 工作，参与了一个叫 Electron 的项目。这是一种构建应用程序的方法，使得程序在 Windows 和 macOS 上运行和看起来大致相同。我们首先将其用于 Visual Studio Code，也就是现在 Cursor 等很多工具的基础。当 Visual Studio Code 最初在公司内部发布时，有一种感觉是这是一个玩具，不是给真正的开发者用的，因为真正的开发者需要 Visual Studio。这就是为什么它的名字那么长，因为 Microsoft 觉得真正的专业人士得用那种带有各种高级工具的大型应用。从那以后发生的事情是，你不再需要深入研究计算机底层了。对于从事软件工作的朋友，我本周刚感慨过，我今年查看汇编语言的次数是零。而在五年前，这还不为零。现在查看底层技术已经变得非常罕见了。

另一件发生的事情是，作家Margaret Atwood 最近写了她使用 Claude 的心得。我在想，如果 Margaret Atwood 这种非技术背景的人去做软件，那会是什么样。我认为这对我来说会很有趣，而且我很确定我会安装并尝试。所以我预测，未来会有多得多的软件出现，而且会变得更加专业化。并不是说每个人都要自己写代码，人们仍然会构建东西并与他人分享，而其他人也仍然喜欢使用感觉良好的好软件。但做这件事所需的Skills将发生转变，将从一个仅仅说计算机语言的人，转向一个说人类语言的人，现在软件是为人类而构建。

我认为 20 年前成功的软件开发者非常擅长理解计算机。在那个时代，要构建成功的软件，你必须成为计算机专家。而我认为，未来能构建成功软件的人将越来越深刻地理解人类和用户。这其实是一个渐进的过程，某种程度上已经在发生了。比起 30 年前，10 年前开发软件已经容易得多，而 AI 带来了另一个阶跃式的突破。针对你提出的还剩下什么可以做的问题，我认为还有成堆的事情可以实现自动化，有无数的工作可以简化，有海量的问题等待解决。只要人类还有疑问和难题，软件就是一个合理的答案。

AI 的进化远未触及天花板

回顾过去几年的飞速发展，你认为AI Agent 的能力终点在哪里？虽然有人预期增长会进入平台期，但你为何认为这种进化正在加速？除了软件层面，你认为 AI 在物理世界或旧设备市场是否还存在被忽视的机会？

Felix Rieseberg: 这对我来说挺棘手的，因为我原则上不喜欢在功能实际存在之前开空头支票。我的营销哲学一向是先做出酷的东西再展示。有一点让我感到困惑，那就是大家似乎很快就忘了我们在AI 领域已经取得了多大的进步，反而开始预期增长平台期会很快到来。我想这是因为过去的技术发展给大众留下的固有印象。比如 iPhone 问世后的很长一段时间里，每一代更新都是巨变，但过去几年，这种变化确实变小了。

但作为 AI 的观察者，我没有任何理由认为 AI 会在短期内进入平台期。我想提醒大家，AI 学会组织有意义的句子才不过短短几年，而现在 AI 已经能构建完整的应用程序，并解决复杂问题。对我来说这远非巅峰，我们还在旅途中，而且有理由相信这个进程正在加速，进化的步子会越来越大。Mythos Preview 实际上是一个有力的证明，它说明这不只是理论。模型会越来越聪明，目前还看不到进化的终点。

（关于受监管行业与机会）你不是唯一一个提出这个需求的人。我们经常听到受监管行业客户的反馈，每当用户提出要求，我们都会非常仔细地倾听，这毕竟是我们的本职工作。到 2026 年，最让我兴奋的依然是帮助人们重新组织工作，从而最大化地发挥 AI 的潜力。这种说法可能比较抽象。我曾在 Slack 工作过五年。那时候我们觉得自己正在帮公司彻底改变工作方式，虽然我们不是第一个聊天应用，也不是第一个提出消除信息孤岛的公司。但我们卖给客户的不仅是一个聊天工具，而是一套更透明、更开放的工作逻辑。AI 的变革也是如此。只有当你重新审视自己的工作流程，思考哪些部分可以交给模型，哪些部分你想要完全掌控时，工具才能发挥最大效用。这个领域让我非常兴奋。

另一个让我兴奋的是用户分层。如何缩短普通用户成为高级用户的路径是一个巨大的机会。所以 Cowork 用户会发现，我们每周都在推送有意义的更新，这种进化停不下来。

在当前的 AI 浪潮中，哪一个想法被严重低估

在当前的AI 浪潮中，哪一个想法被严重低估了，哪一个又是被过度炒作的？如果你今天从头开始孤军奋战，你会选择深耕哪一个尚未被 AI 触及的长尾市场？

Felix Rieseberg: MCP 连接器被低估了。虽然包括我在内的很多人已经从 MCP 转向了命令行界面，但将数据与执行引擎分离有很多本质好处。这是一个非常技术性的观点，但我经常和人讨论。MCP 在去年秋天非常火，现在热度降了，但我认为到今年底或明年，它会对大多数人产生巨大价值。就像普通用户不需要懂底层协议也能使用 Amazon 或 TikTok 一样，MCP 也是一种底层协议。工程师们应该给予它更多关注。

（关于过度炒作的观点）作为 AI 从业者，身边全是炒作。我有一个观点：并不是每个产品都需要聊天框。这在 2026 年的 AI 圈可能是一个相当辛辣的观点。我认为 AI 对大多数软件都有帮助，这没错。但很多工程师的条件反射是，只要给产品加 AI，就在右侧加个侧边栏，底下放个对话框。我建议同行们多往深处想一步，如何才能让这个功能真正变得有用。

（关于未来的创业方向）如果我必须孤军奋战，我可能会去挖掘行业的长尾市场。世界上有无数运行着 Windows 7 的旧设备在处理琐碎但关键的任务，支撑着社会的运转。这细想起来挺可怕的，因为现代 AI 完全触及不到这些设备，但它们又在社会中承担着重要职能。我可能会考虑这个方向。另一个方向是深耕物理世界。如果你认同 AI 的核心在于让计算机不再只是执行预设函数，而是能自主决策并代表你执行，那么进入物理世界将是大势所趋，这也是我对年轻人的建议。我们现在真的还处于极早期。现在的 AI 产品就像移动电话早期的荒蛮时代。如果我们足够幸运，也许我们目前正在开发的是诺基亚 3310，它是一部好手机，但还远不是真正的智能手机。有人终将造出 AI 界的 iPhone。