「前沿思维」当两大 AI 巨头撞在一起:OpenAI vs. Anthropic 的终局之战,与 Agent 时代的到来

欢迎来到「前沿思维」。

这是我开的一个新专题，声音形式的。

很久没写公众号了，一个是个人生活有很大变化，没有太多时间了；另一个原因是我有点时间就在玩AI，久而久之便不想写了。

让我燃起兴趣的是，最近受到一位博主的启发，我觉得可以用AI的能力把外文世界里那些最锋利、最前沿的思维带到中文世界里，用“音频播客”的形式。

我好奇世界上最顶级的大脑每天都在想什么。

于是我就这么做了，从想法到落地，耗时2天。真感叹AI时代的伟大。

需要注意的是，以下整个过程，“含人量”非常低，几乎都是AI Agent自己完成的。

首先，我会选择外文播客里关于科学、技术、AI等领域里真正有观点、有火花的节目、那一期，尤其是一些重量嘉宾的访谈，把它从音频拆解成三个层次：

一是内容本身：转译成中文，保留原始观点。

二是背景知识：补上原节目默认读者才知道的上下文和“隐形信息”，让你不用翻墙搜半天。

三是观点微加工：在不歪曲原意的前提下，做少量的重组和对比，把它放进国人熟悉的现实里，这样我们可以更好理解。

另一方面，我通过声音克隆技术，尽量保留嘉宾说话时的节奏、气口、情绪，这样，在中文世界里，也能尽可能听到原汁原味的那个人。

每一期，我还会把核心论点、关键金句和思维框架整理成文字，放在文章里。这样你不用重听一小时音频，就能抓住这些顶级的嘉宾到底在想什么、他们对于未来的思考是怎样的。

如果你对 AI、科技和未来世界的好奇，不满足于「新闻摘要」和「剪辑短视频」，那就把「前沿思维」当成你的一个固定据点：

这里没有统一答案，只有各种认真思考的人。

而我要做的，是把他们请到你耳边和手机里，让你随时和他们“对话”。

今天这一期的英文标题是：OpenAI vs. Anthropic's Direct Faceoff + Future of Agents，原始音频来自 Big Technology Podcast，主持人是科技记者 Alex Kantrowitz，嘉宾是 Box CEO Aaron Levie，

这一期主要在聊三件事：

1. 当 OpenAI 和 Anthropic 做出几乎同一条产品线时，这场「大模型实验室之战」到底会怎么演变。

2. AI 从聊天机器人进化成 Agent 之后，意味着什么——它不再只是回答问题，而是要真的帮你把活干完。

3. 为什么在真实企业里落地 Agent，会比硅谷想象的慢很多，但反而因此藏着最大的机会。

嘉宾的核心观点：

1. Anthropic 押的是「企业 + 编码 + API」，OpenAI 押的是「消费者入口 + ChatGPT」，但现在两家的产品路线已经高度收敛到了同一个终点：通用知识工作 Agent。

随着 coding 模型在 2024 年底左右强到可以长时间无中断写代码、非技术人也能用时，两家公司都发现：真正的机会是做一个“帮你干各种活的超级 Agent”——既能当助手，又能直接做事。

2. Labs 真正争的是：谁能成为那个「默认的通用知识工作 Agent」，挂在所有人的工作流中间；而不是单纯比谁今天的模型更聪明一点。

背后有三个含义：

a. 模型差距是短期的，工作流位置是长期的：算力和研究差距可以追，但一旦谁成为“企业标准工作入口”——所有任务先进它这里，再发到别的系统——锁定效应会非常强。

b. Agent 让 TAM 从工程师扩展到所有知识工作者：如果你只做编码助手，你的上限是“所有工程师”；如果你做的是“能写代码 + 调工具的通用 Agent”，上限就是“所有知识工作者”。

c. 真正落地难点不在实验室，而在企业自己的数据和流程：真正的机会不只是「做更强的模型」，而是谁能把企业从内部复杂的数据地狱里，迁到一个 Agent 可用的上下文结构上。

在 10 人初创公司眼里的 Agent Demo，和在 1 万人传统企业里的真实落地，是两种完全不同的物种；后者的扩散速度会比现在 Twitter 上的想象慢一个数量级。

谁能成为企业里的默认 Agent 工作入口、谁能真正吃进工作流，那才是长期差异所在。

以上是本期内容的文字摘要。

另外，嘉宾在博客里提到了Perplexity的Computer模式，碰巧我是这款软件的重度用户，这个模式或许是现阶段Agent的比较理想的模式，简单来说就是：自己跟自己死磕，较少幻觉，牢记使命，直到完成我给他布置的任务。

当然，也许Mythos出来后，这些都不是事儿了。

下一步，这个专题除了会把AI流程优化的更顺畅、解决一些语音bug以外，我还会探索更多好玩的方向，如果你有兴趣，不妨一起探讨。