「前沿思维」当两大 AI 巨头撞在一起:OpenAI vs. Anthropic 的终局之战,与 Agent 时代的到来欢迎来到「前沿思维」。
这是我开的一个新专题,声音形式的。
很久没写公众号了,一个是个人生活有很大变化,没有太多时间了;另一个原因是我有点时间就在玩AI,久而久之便不想写了。
让我燃起兴趣的是,最近受到一位博主的启发,我觉得可以用AI的能力把外文世界里那些最锋利、最前沿的思维带到中文世界里,用“音频播客”的形式。
我好奇世界上最顶级的大脑每天都在想什么。
于是我就这么做了,从想法到落地,耗时2天。真感叹AI时代的伟大。
需要注意的是,以下整个过程,“含人量”非常低,几乎都是AI Agent自己完成的。
首先,我会选择外文播客里关于科学、技术、AI等领域里真正有观点、有火花的节目、那一期,尤其是一些重量嘉宾的访谈,把它从音频拆解成三个层次:
一是内容本身:转译成中文,保留原始观点。
二是背景知识:补上原节目默认读者才知道的上下文和“隐形信息”,让你不用翻墙搜半天。
三是观点微加工:在不歪曲原意的前提下,做少量的重组和对比,把它放进国人熟悉的现实里,这样我们可以更好理解。
另一方面,我通过声音克隆技术,尽量保留嘉宾说话时的节奏、气口、情绪,这样,在中文世界里,也能尽可能听到原汁原味的那个人。
每一期,我还会把核心论点、关键金句和思维框架整理成文字,放在文章里。这样你不用重听一小时音频,就能抓住这些顶级的嘉宾到底在想什么、他们对于未来的思考是怎样的。
如果你对 AI、科技和未来世界的好奇,不满足于「新闻摘要」和「剪辑短视频」,那就把「前沿思维」当成你的一个固定据点:
这里没有统一答案,只有各种认真思考的人。
而我要做的,是把他们请到你耳边和手机里,让你随时和他们“对话”。
今天这一期的英文标题是:OpenAI vs. Anthropic's Direct Faceoff + Future of Agents,原始音频来自 Big Technology Podcast,主持人是科技记者 Alex Kantrowitz,嘉宾是 Box CEO Aaron Levie,1. 当 OpenAI 和 Anthropic 做出几乎同一条产品线时,这场「大模型实验室之战」到底会怎么演变。2. AI 从聊天机器人进化成 Agent 之后,意味着什么——它不再只是回答问题,而是要真的帮你把活干完。3. 为什么在真实企业里落地 Agent,会比硅谷想象的慢很多,但反而因此藏着最大的机会。1. Anthropic 押的是「企业 + 编码 + API」,OpenAI 押的是「消费者入口 + ChatGPT」,但现在两家的产品路线已经高度收敛到了同一个终点:通用知识工作 Agent。随着 coding 模型在 2024 年底左右强到可以长时间无中断写代码、非技术人也能用时,两家公司都发现:真正的机会是做一个“帮你干各种活的超级 Agent”——既能当助手,又能直接做事。2. Labs 真正争的是:谁能成为那个「默认的通用知识工作 Agent」,挂在所有人的工作流中间;而不是单纯比谁今天的模型更聪明一点。a. 模型差距是短期的,工作流位置是长期的:算力和研究差距可以追,但一旦谁成为“企业标准工作入口”——所有任务先进它这里,再发到别的系统——锁定效应会非常强。b. Agent 让 TAM 从工程师扩展到所有知识工作者:如果你只做编码助手,你的上限是“所有工程师”;如果你做的是“能写代码 + 调工具的通用 Agent”,上限就是“所有知识工作者”。c. 真正落地难点不在实验室,而在企业自己的数据和流程:真正的机会不只是「做更强的模型」,而是谁能把企业从内部复杂的数据地狱里,迁到一个 Agent 可用的上下文结构上。在 10 人初创公司眼里的 Agent Demo,和在 1 万人传统企业里的真实落地,是两种完全不同的物种;后者的扩散速度会比现在 Twitter 上的想象慢一个数量级。谁能成为企业里的默认 Agent 工作入口、谁能真正吃进工作流,那才是长期差异所在。另外,嘉宾在博客里提到了Perplexity的Computer模式,碰巧我是这款软件的重度用户,这个模式或许是现阶段Agent的比较理想的模式,简单来说就是:自己跟自己死磕,较少幻觉,牢记使命,直到完成我给他布置的任务。下一步,这个专题除了会把AI流程优化的更顺畅、解决一些语音bug以外,我还会探索更多好玩的方向,如果你有兴趣,不妨一起探讨。