乐于分享
好东西不私藏

万字实录| 红杉AI峰会2026主旨演讲:从软件时代到智能体时代的范式跃迁 | 全文图解

万字实录| 红杉AI峰会2026主旨演讲:从软件时代到智能体时代的范式跃迁 | 全文图解

城主说|在科技发展的宏大叙事中,我们正站在一个足以媲美工业革命的十字路口。近日,在备受瞩目的红杉资本“人工智能巅峰”行业峰会上,红杉资本的核心合伙人们与硅谷的顶尖创业者和技术专家齐聚一堂,共同探讨这场正在重塑世界秩序的变革。

本次会议揭示了一个核心共识:我们正从单纯的“软件时代”迈向全方位的“智能体时代”。会议深入探讨了 AI 浪潮的独特性,指出它是一场计算革命而非单纯的通信革命。核心议题围绕“智能体(Agents)”作为新一代服务的崛起展开,提出了 MADS 战略框架(护城河、可供性、扩散),并展望了未来机器将完成 99.9% 认知工作的图景。尽管技术将重塑劳动力和生产力,但会议强调,人与人之间的联结仍是价值的终极来源。

核心观点

  • • 计算革命与 AGI:AI 是关于信息处理的计算革命,不同于以往的通信革命。长周期智能体的出现标志着商业意义上 AGI 的降临。
  • • MADS 框架:在模型之上构建竞争力的三要素——以客户为中心的护城河(Moats)、降低使用门槛的可供性(Affordance)以及填补能力落差的扩散(Diffusion)。
  • • 智能体即服务:软件正在向服务演进,智能体将以极低的边际成本实现无限规模化的专业服务(医疗、法律、开发等)。
  • • 认知工业革命:认知工作将重演工业革命的历程,未来绝大部分认知劳动将由机器完成,世界将进入“异类设计”和新科学发现的时代。
  • • 人工智能是一场关于信息处理的计算革命,而非单纯改变分发方式的通信革命。
  • • 软件正在向服务演化,智能体将以极低的边际成本,实现规模化的法律、医疗等专业服务。
  • • 长期异步智能体的成熟,标志着商业意义上的通用人工智能(AGI)已经降临。
  • • 护城河不再仅仅源于技术能力,而在于与客户需求的深度绑定及阻力最小的使用路径。
  • • 未来99.9%的认知劳动将由机器完成,世界将进入“异类设计”与新科学发现的爆发期。
  • • 当机器承揽了所有工作,人与人之间的联结与情感体验将成为价值的终极来源。

不仅仅是更快的马:计算革命的本质

回顾科技史,从硅基晶体管到移动互联网,每一波浪潮都在为今日的爆发积蓄动能。然而,当前的人工智能浪潮与以往有着本质的差异。“这波浪潮是首个兼具软件与服务属性的变革,” 红杉资本的合伙人在开场中指出,云转型的前十五年将软件市场推向了数千亿美元的规模,但人工智能所触及的是价值十万亿美元的服务市场。仅在美国,法律服务的市场规模就足以等同于整个软件行业。

更深刻的差异在于技术本质。互联网、云技术和移动端本质上是“通信革命”,旨在改变信息的传播与分发。而人工智能则是一场“计算革命”,它关乎信息是如何被处理和重塑的。这种底层逻辑的转变意味着,我们不仅是在制造“更快的马”——即提升10%或40%效率的生产力工具,而是在制造“汽车”——那些能彻底改变工作本质、组织形态乃至社会运行规则的颠覆性应用。

商业通用人工智能的降临:从自动化到自主化

在过去两年中,技术转折点接踵而至。从预训练模型的震撼问世,到推理能力的大幅跃升,再到如今能够处理长周期任务的智能体崛起。虽然学术界对通用人工智能(AGI)的定义仍有争论,但从商业和实践的角度看,变革已经发生。“如果你能指派一个智能体去完成一项工作,并且它能在遇到故障后自我修复并持续工作直到任务完成,这就是商业意义上的通用人工智能。”

智能体不再是简单的代码行间辅助,它们正演变为能够感知环境、选择行动并自主达成目标的复杂系统。从代码编写到建筑服务销售,从内部办公流程到复杂的科研任务,智能体的表现已经从“分钟级”的持续性跨越到了“小时级”甚至更长。这种“把事情办成的能力”,正在将人类从繁琐的流程中解放出来,转向更高层级的战略管理。

策略框架:在基础模型之上构建护城河

对于在基础模型之上进行创新的初创企业而言,如何在技术快速演进的洪流中站稳脚跟?峰会提出了一个关键的战略框架,即由护城河、可供性与扩散组成的竞争力支柱。

首先是护城河。在计算革命中,底层技术的变化日新月异,但客户的需求往往保持稳定。“为了构建护城河,你实际上应该关注客户需求,因为你所构建的技术在明天可能就会变得无关紧要,而你以客户为核心的紧密程度则会更加持久。” 其次是可供性,即为客户创造阻力最小的路径。优秀的智能体产品应该像锤子一样,无需解释,用户一看便知如何使用。最后是利用技术能力与市场落地之间的“扩散鸿沟”,这正是应用层公司的巨大机遇所在。

服务即软件:重塑十万亿美元的产业版图

“服务即新一代软件。” 这一判断预示着传统软件行业的终结与服务业的智能化重生。在医学领域,智能体可以根据个体的基因组提供个性化建议;在法律领域,它们能代表客户进行合同谈判甚至法律诉讼。

相比于人类员工,智能体具备无限的规模化潜力与极低的边际成本。“人类难以实现规模化,且成本高昂;而智能体可以通过算力实现无限扩张,且你只需要支付令牌成本,而非薪水。” 尽管人类目前在适应力上仍具优势,但随着“苦涩的教训”——即算力终将战胜人类经验的规律持续发生作用,智能体在专业领域的表现将很快超越普通人类。一个由异步智能体自主运行、甚至机器制造机器的“黑灯工厂”时代正在加速到来。

认知的工业革命:走向机器主导的创造力时代

如果我们把工作分为体力与认知两类,那么人类已经完成了体力的工业革命。今天,全球超过99%的体力劳动由机器完成。而现在,认知领域正在重演这一进程。“我们相信,在不久的将来,地球上99.9%的认知工作将由机器完成。”

这一转变将带来三个深刻的影响:第一,智能将成为像铝一样的廉价商品。曾经珍贵如珠宝的铝,在电解法发明后变成了随手可丢的包装材料;曾经需要数十年磨练的博士级技能,未来可能只需调用一次令牌即可获得,用完即弃。第二,世界将进入“异类设计”阶段。机器的逻辑不同于人类直觉,当人工智能设计芯片或建筑时,会产生效率极高但外观怪异的作品,我们必须保持开放心态。第三,人工智能将催生出如热力学般基础的新科学,将神经元与令牌的运作系统化、公式化,帮助人类最终掌握意识的奥秘。

人是万物的尺度:在技术洪流中守望人性价值

当机器可以处理所有认知任务,甚至能比人类更好地进行艺术创作时,人类的价值何在?峰会引述了古希腊哲学家普罗泰戈拉的名言:“人是万物的尺度。” 任何脱离了人类体验的事物,其价值都将不复存在。

就像摄影技术的出现并没有终结绘画,反而催生了印象派与表现主义一样,人工智能的普及将逼问我们艺术与工作的本质。“人工智能可以完成工作,但唯有人与人之间的联结,才能让你找到在乎的理由。” 在这个技术指数级增长的时代,那些让我们之所以为人的特质——情感、关系与共同的体验,反而成为了最稀缺、最珍贵的资产。十年之后,工作方式或许会翻天覆地,但那些在变革中建立的人际纽带,将是我们在人工智能巅峰之上最持久的收获。

天空之城全文整理图解


宏观校准:AI 浪潮的独特性

帕特·格雷迪: 大家早上好,你们过得怎么样?很好,很好,感觉好多了。嘿,感谢大家来到这里。我们对此深表感谢。我们这样做是为了回馈社区,因为我们正处在一个重要的时代,能够为大家提供一个相聚的场所,这对我们来说是一种荣幸。这是我们迄今为止制定的最棒的议程,也是我们见过最优秀的参会者阵容。所以,我们首先想说的是,谢谢大家。我们知道你们都忙得不可开交。感谢你们今天能出席。像往常一样,我们准备了一份非常特别的议程,索尼娅,穿着无可挑剔的服装,康斯坦丁和我将先讲几句开场白。

我们有幸参与了许多与各界有趣人士的对话,因此每年我们都希望尝试将其进行一定程度的整合,并将我们所听到的内容分享给你们。所以,我会先做几句整体性的校准说明,然后由索尼娅谈谈我们当下的所见,接着由康斯坦丁谈谈我们对未来的展望。

在校准部分,我们先从宏观视角切入,回到硅基晶体管的时代,正是它赋予了该领域名称,随后这些晶体管被构建成由网络连接的系统,并以互联网的形式走向大众,支持了诸如云端社交媒体等应用,最终以移动设备的形式出现在我们的口袋里,而这些设备在今天所能实现的功能与魔法无异,那就是 AI。我们喜欢展示这张幻灯片,以前来过这里的人应该都见过,是因为它提醒我们,所有这些浪潮都是相辅相成、不断叠加的我们似乎经历了数十年的演进,才积攒了足够的算力、带宽、数据和人才,从而把握住当下的这个时刻

现在,这股 AI 浪潮有些不同。体现在三个方面

索尼娅·黄: 首先,这是迄今为止规模最大的一波浪潮

帕特·格雷迪: 这通常是事实,但这波浪潮有着更具体的独特性,即它是首个兼具软件与服务属性的浪潮。第一行展示了云转型的前15年,期间软件的市场规模(TAM)从约3500亿增长到6500亿,而云服务在其中占据了约4000亿的市场份额。第二行所展示的是全新的内容。这指的是目前似乎同样可获取的服务收入。10万亿是一个相当整齐的整数。我们无法确定最终规模是10万亿、5万亿还是50万亿。但我们确实知道,仅在美国,法律服务就是一个4000亿美元的市场。这仅仅是一个垂直领域和一个地理区域。其规模就已等同于整个软件行业。因此,这一机遇是巨大的

第二点。这是迄今为止最快的一波浪潮。我想我们都能感受到这一点。这意味着这片空白区域——请大家关注页面上 AI 这一侧——正在被迅速填补。这些图标所代表的公司,正是得益于云计算、移动端以及现在的 AI 技术变革,才实现了超过 10 亿美元的营收。

康斯坦丁·布勒: 按照目前的进程和速度,未来还会有更多公司加入其中

计算革命与商业 AGI

帕特·格雷迪: 第三点。这可能是最有趣的一点,我借用了我的合伙人康斯坦丁的观点,即技术革命基本分为两种类型。一种是通信革命,旨在改变信息的传播方式。在座的大多数人所经历的,仅仅是通信革命。互联网、云技术、移动设备,这些本质上都属于信息分发。这些是通信领域的革命。AI 则有所不同。AI 属于这一类。AI 是一场计算革命。它关乎信息是如何被处理的。这听起来可能只是语义上的区别,但它们在波形本质上截然不同。

或许最直观的感受方式是意识到:脚下的地基一直在移动。随着新功能的不断涌现,每个人所构建的底层技术基础也在日新月异地变化。在过去的几年里,我们经历了三个主要的转折点。第一个是 ChatGPT 时刻。2022 年 11 月,世界见证了预训练的强大能力。第二个是几年后的 o1 模型,即推理能力。突然之间,围绕推理时间计算的第二条缩放定律出现了。第三个是最近出现的 Claude Code Opus 4.5 ,现在是 4.7。世界见证了长周期智能体的强大能力

虽然这看起来像是连续体上的三个点,但第二和第三个转折点之间存在某种程度上的断层。这是一种非连续性的变化。如果不揣冒昧地说,我们认为这就是 AGI。而且,我可是学经济学专业的。我们是风险投资人,不会去提出关于 AGI 的技术定义。好吗?我们研究创始人、市场以及两者的碰撞,也就是商业。但我们确实在研究商业。因此,从商业角度、实践角度以及功能角度来看,如果你能指派一个智能体去完成一项工作,并且它能在遇到故障后自我修复并持续工作直到任务完成,这就是商业意义上的通用人工智能

即使你认为那不是 AGI,也没关系,顺便说一下,索尼娅会在她的部分详细讨论这一点。即使你认为那不是 AGI,我也不认为那是 AGI,但我认为我们都能看出汽车已经到来了。过去几年里,我们见过了很多更快的马。那些让你生产力提升 10% 或 40%,却并没有从根本上改变你工作方式的应用程序。现在我们开始看到汽车了。那些让你生产力提升 10 倍或 40 倍,并彻底改变你工作方式、工作本质以及组织本质的应用程序。汽车时代已经来临。

这是 Sequoia 的创始人 Don Valentine,他以爱问一个问题而闻名:那又怎样?为什么这一切如此重要?之所以重要,是因为就在过去几个月里,这场竞赛已经开始了。而且这与我们习惯的竞赛截然不同。驾驶汽车的方式与骑马的方式是不同的。制造汽车的方式与照料马匹的方式也是不同的。所以,这是一种非常不同的竞赛。我们今天想把大家召集到这里的原因之一,是因为没有人拥有所有的答案。我们在一起交流的时间越多,就能学到越多,并有望弄清楚这一切将走向何方。

构建策略:MADS 框架

帕特·格雷迪: 我们务必尽快采取行动,因为仅从商业角度来看,这关乎巨大的利益。市场规模高达 10 万亿美元。我们有实验室正从技术驱动的角度开展研究。我们也有初创公司正在以客户需求为导向进行开发。虽然在座各位代表了所有相关实验室,但你们大多数人是在现有基础上进行构建。所以我们花一点时间,来讨论那种以客户需求为导向的方法。

对于那些在现有实验室基础上进行构建的人,我们有些建议——既然是免费建议,那它就值你们付出的每一分钱——我们的建议是去参考 MADS。其实我们并不需要你们感到愤怒(Mad)。如果你们愿意,当然也可以感到愤怒。如果那是驱动你们的动力,那也挺好的。尽管生气吧。但这只是一个方便的缩写,指代可供性(Affordance)、护城河(Moats)与扩散(Diffusion),这是在模型之上构建策略的三个特征或三大支柱。

首先谈谈护城河,纯粹为了好玩。有人记得去年的这张幻灯片吗?有一位,他还是我的合伙人。好的,那很酷。提醒一下,这张幻灯片展示了商品化周期,即从创意到实现客户满意所需经历的价值链环节。我们实际上不会逐一去过这些价值链环节。我想在这里指出的是,如果你从技术的角度出发,价值链中的每一个环节都会以略有不同的方式被处理。如果你从客户的角度出发,那么你在链条中所接触的每一个环节都会略有不同。

现在,这里有一个违反直觉的部分。在这一场关于信息处理的计算革命中,你往往会想要关注下方这些领域,因为那里不断涌现出各种酷炫的新事物。但为了构建护城河,你实际上应该关注上方这些领域。因为你的客户需求变化速度远不及技术能力演进的速度。你所构建的东西在明天可能就会变得无关紧要。而你以客户为核心的紧密程度,则会更加持久。这并不是说产品和技术不重要。它们极其重要。且通常情况下,最好的产品会胜出。但在一个产品迭代极快、能力演进也极快的世界里,当思考商业护城河时,我们建议你尽可能从客户的角度出发,思考所有能够围绕这些客户建立紧密联系的方式。

好的,MADS 中的 A 代表的是 Affordance(可供性)。这是一个我们从设计领域借用的术语。锤子就是一个具有可供性的物体。我有一个两岁的儿子。如果我给他一把锤子,他就会知道该怎么用。他会抓起锤子开始敲打东西。这就是我们不给他锤子的原因。具有可供性的物体是不需要解释的。人们一看就知道该怎么用它。Claude code 极其强大。去让一名普通的财富 500 强企业员工打开终端试试,看看他们能走多远。虽然它很强大,但提供的功能可供性并不多。这并非是对 Anthropic 的批评,但对于任何希望在现有基础上进行构建的人来说,这是一个机会。你可以为特定客户及其具体问题创造阻力最小的路径,让他们能极其简单地达成业务所需的结果。这就是可供性的概念。

最后,MADS 中的 D 指的是扩散(Diffusion)。扩散鸿沟正是那些在应用层进行开发的公司所面临的机会。技术能力向市场扩散的速度,远低于这些能力被创造出来的速度。基础模型的演进速度每天都在超越普通的财富 500 强企业,这一鸿沟正在不断扩大,机会也随之增长。因此,对于护城河(Moats)而言,请尝试以客户需求为导向进行思考。关于可供性(Affordance),试着思考如何为你的客户创造阻力最小的路径。而那个扩散鸿沟,正是你所拥有的机遇。

除非早先那张空白区域逐渐被填满的幻灯片让在座的各位感到沮丧,那么我们需要提醒你们的是,没有任何领先是绝对稳固的。赛车界有这样一句话:你无法在晴天超越15辆车,但你可以在雨天超越15辆车。而现在,基础模型正涌现出如倾盆大雨般的新功能,这意味着没有任何领先是绝对稳固的,但也意味着任何人都有机会胜出。这是一个多么伟大的时代。接下来,我将把它交给索尼娅。 

智能体时代:服务即新一代软件

索尼娅·黄: 我可以再说一句吗?在观众席中看到这么多友好的面孔真是太好了。今天在场的各位都是卓越非凡的人。能与大家共同置身于这个生态系统中,我感到非常高兴。我这一部分的内容旨在探讨人工智能当下的发展,对于2026年而言,核心就是智能体

好,让我们回溯到2022年。请举手示意。这里有人记得 Auto GPT 或 Baby AGI 吗?好的。好的,明白了。这些项目在 GitHub 上一夜爆红。它们的操作方式是调用 GPT3,为其配置一些工具,封装在循环中,并让它朝着目标运行。起初看起来很有前景,直到你看到那些智能体一次又一次地失败。虽然看着挺可爱、挺招人喜欢的,但实际上完全没用。

帕特·格雷迪: 我放这张幻灯片是为了提醒大家,我们其实早就预见到智能体时代的到来

索尼娅·黄: 我们本可以在几年前就预见这一切。但回到2022年,当时的模型确实还没准备好。

帕特·格雷迪: 时间快进到今天,从年初开始,情况确实发生了质的变化。

索尼娅·黄: 突然之间,智能体遍地开花,而且它们似乎真的能够投入实际运作了。其中有两个智能体表现尤为突出:面向技术人群的 Claude Code,以及让任何拥有手机的人都能使用智能体的 OpenClaw 及其所有龙虾系列衍生产品。所以,无论你是硬核工程师还是普通用户,现在的重点在于,人人皆可创建智能体

我们现在看到人们正在为各种用途构建智能体。甚至还有一些荒唐的例子,比如有的 open-call 智能体会专门去举报邻居的税务欺诈行为。请不要这样做。或者实际上,也许请这样做。还有创业相关的事情。运行生成式媒体活动来销售建筑服务的 Agent。然后还有一个专业层面。我可以告诉你,在 Sequoia 内部存在一场巨大的竞赛,看谁能构建出最好的 Agent 来更好地完成我们的工作。

那么,成为一个 Agent 意味着什么?这里有一个可能的定义。Agent 是一个系统。它感知其环境,选择行动,并自主地朝着一个目标前进。顺便说一下,我想这是我自己用 C-dance 制作的。我对此感到非常自豪。视频模型已经取得了长足的进步。更具体地说,我认为智能体具有三个功能组件。首先是推理和规划的能力。这是直觉的基准水平以及即时思考的能力。其次是采取行动的能力。这包括使用工具、搜索、编写和编译。最后是朝着目标不断迭代的能力。这正是赋予智能体在长周期内完成任务能力的持久性。因此,代理(agency)结合了这三样东西。简而言之,就是把事情办成的能力。

如果我们把代理拆解为模型、工具和协作框架(harnesses)这些组成部分,过去一年里每个部分都在飞速进步。首先,模型即大脑。这是目前发生的最重要的事情。衡量指标图表测量的是模型在执行复杂任务时,能够持续推进而不偏离轨道的时间长度。我们已经从一年前的十分钟量级发展到了今天的数小时量级。所以,这是目前发生的最重要的事情。模型终于变得足够强大,能够维持长周期任务的性能表现。

其次,工具即手脚。这些赋予了模型访问各种能提升我们计算机生产力工具的能力,例如用于文件系统和开发工具的终端、iMessage、Slack、网页搜索、计算机使用等等,应有尽有。过去二十年间我们为人类打造的各种工具,最终也能够转化为对智能体而言极其有用的资源。有一种普遍的论调认为 SaaS 已死。但我认为恰恰相反,随着使用这些工具的智能体数量增加,其价值将会爆发式增长。

增加。模型和工具赋予了智能体执行能力。而控制框架(harness)则赋予了它们持久性。即保持任务专注、进行调整并持续运行的能力。这一反馈回路现在确实开始加速运转了。特别是在有了强化学习之后,我们正在对这些智能体进行“驾驶学校”式的训练,也就是在 RL gyms 中训练它们。

帕特·格雷迪: 我们正在不同领域推动性能的提升,从机械工程到设计,旨在寻找突破。我们同时也看到了自我改进的初步曙光,即机器制造机器

索尼娅·黄: 例如,Andrej 的另一个研究项目在短短两小时内自主提升研究能力,达到了 GPT2 级别模型的水平。

那么,一个到处都是智能体的世界会是什么样子?智能体的存在处于一个智能程度的滑动量表上,让我们以编程为例。在 2023 年,我们拥有了标签页自动补全功能。这是一种 AI 在行间辅助人类的方式。

帕特·格雷迪: 这种方式虽然在增量上有所助益,但从根本上说并不具备变革性。

索尼娅·黄: 我们现在拥有了智能体开发,即一个人与一个智能体对话,指导它做什么,或许还能管理一个智能体团队。但这种范式正在被进一步推进。我们现在看到了后台智能体、异步智能体以及能够衍生出子智能体的智能体。我们认为,在这种整体范式下,异步智能体极有可能在规模上超越当前范式,这仅仅是因为该系统所能提供的杠杆效应。

帕特·格雷迪: 最后,在推进前沿尖端领域方面,即我所说的“黑灯工厂”,将人类审查彻底从系统中剥离

索尼娅·黄: 这听起来很疯狂,但我已经在生产环境中见过这种情况,包括在网络安全公司中。只要具备足够可靠的护栏机制和足够优秀的工程能力,这是完全可能的。因此,我们正在智能体化的进程中不断攀升。智能体正从在你身边提供微小协助的助手,进化为需要管理的实习生,进而转变为能够自我管理的实习生,最终演变为值得信赖、无需监督即可部署到生产环境的实习生。这就是正在发生的演进,不仅是在代码编写领域,而是覆盖了所有智能体应用。

对于在座的创始人而言,最重要的启示是:服务即新一代软件。帕特在我认识他以来一直强调这一点,我们的合伙人 Julian(他今天也在观众席中)也发表过一篇关于此话题的优秀文章。我们对此早已知晓,但我认为这一趋势正在真正地成为现实。在医学领域,你可以聘请一个尊重你的基因组、为你提供个性化建议、能够为你开具处方药物并推荐临床试验的智能体。在法律领域,你将能够聘请能够代表你协商合同,甚至进行诉讼并为你达成和解的智能体。在数学和科学领域,我们正看到能够解决这些问题或发现新型超导体的智能体。这难道不令人振奋吗?

或者在消费领域,那些可以为你管理收件箱、日程表、财务状况以及申报税务的个人智能体。我们预计未来智能体将无处不在。这在一定程度上是因为聘请智能体比雇佣员工要容易得多。人类难以实现规模化。而智能体可以通过算力实现无限规模化。让员工保持满意度是一件困难的事。除了我以外,我总是很快乐。Agents 的维护成本很低。人类的成本很高。你需要支付他们薪水。你需要支付 Agents tokens。通常情况下,用 tokens 完成任务的成本要低于支付等值的薪水。

现阶段,人类通常仍然更聪明。但 bitter lesson 的影响持续存在,很快 Agents 在许多方面就会变得更聪明。因此,这张幻灯片的重点并不是说我们人类要失业了。我认为适应力是人类独有的特质。但我们预计智能体在应用层的部署将会迅速进行,且规模增长速度前所未有,因为其经济效益显而易见,且具备固有的可扩展性。综上所述,智能体的数量正以某种指数级,或许是超指数级的速度激增。

当商业活动在智能体之间展开时会发生什么?它们可以互相支付吗?当智能体能够自行协商交易条款时,会发生什么?未来是否会出现成群结队的智能体来监管我们,以防范网络安全威胁或 Megadon 之类的事件?我们只知道这个世界正在极速变得诡异。

最后,我想借用 Bene Gesserit 的心境来结束此次发言。Long Horizon 智能体已经到来。它们所处的曲线,非常清晰。对于创始人而言,我想每个人都有看到人们借助 AI 在极短时间内完成艰巨任务的案例。例如,来自 Z’d 的 Nathan 在假期期间独自一人利用 Claude 完成了一个原本需要三年的登月级项目。Brett Taylor 用一个周末的时间重建了 Sierra。Notion 团队仅用了六周时间就重写了 800 万行代码。

因此,每个人都有这些时间线被压缩的例子。但我认为,在 AGI 实验室之外,很少有人真正见识过会发生什么。当你将这些被压缩的时间线进行叠加时。而这正是现在所能实现的。所以,无论你想象中未来一百年能构建出什么,我们认为借助智能体,现在一百天内就能实现。接下来我将交给康斯坦丁。

未来展望:认知的工业革命

康斯坦丁·布勒: 谢谢你,索尼娅。好的,非常感谢索尼娅和帕特带来的精彩概述与分析。在这一部分,我们将简要探讨接下来的发展方向。我们的目标是,因为我们都知道自己正处于 AI 时代。它将会是什么样子?它将会带来怎样的体验?它的特征是什么?

在演示的前半部分,帕特将技术革命分为计算和通信两个维度。我们在这里将工作类型再进行一次划分。一种是体力工作。这可以是 Pony Express 上的包裹,也可以是 Falcon 9 运载的卫星。工作等于力乘以位移,即物理位移。接下来是认知工作。例如 Pythagoras 提出该定理。例如 DeepMind 解决蛋白质折叠问题。有意识的思考。这些是非常不同类型的工作。但我们相信它们将遵循非常相似的变革模式。

那么让我们谈谈体力工作,因为我们已经经历过工业革命带来的变革。

帕特·格雷迪: 在人类历史的绝大部分时间里,世界上所有的工作,或者说几乎所有服务于人类的工作,都是由某种肌肉力量完成的。

康斯坦丁·布勒: 依靠人或动物。靠人去搬运东西,或者靠动物牵引人类前行。这一切始于1700年,但其渊源可追溯至几千年前。随后,局面开始发生转变。水力和风力。蒸汽机。此后,进程开始加速。蒸汽机。内燃机、电动机。时至2026年,可以估算得出,地球上超过99%的人类体力劳动已由机器完成。将你带到此处的飞机、房间内所有物品的制造,以及支撑你此刻所体验的人类巅峰生活的各项运输保障。

我们认为认知的演进也将经历类似的历程。我们只是处于一个较早的阶段。在人类历史的大部分时间里,地球上所有的人类思考主要都是由人类完成的,或许还有一点来自动物,比如牧羊犬驱赶羊群。在机械劳动之上,曾存在过一小部分辅助工具,例如星盘或时钟。

帕特·格雷迪: 现在,在过去几百年里,进展其实并不大。直到电子计算出现。

康斯坦丁·布勒: 而在过去一百年里,试想一下,此时此刻为了服务你这样的人类,正在进行着数以万亿计的计算。所有这些工作,所有这些正在发生的认知工作,都是为了在任何时刻服务于我们。数以万亿计的计算。我们相信 neural network 是下一个大浪潮,并且在不久的将来,地球上 99.9% 的认知工作将由机器完成

这种类比非常鲜明,好消息是我们已经经历过这样一场革命。认知革命将与工业革命非常相似,只是规模要大得多,速度也快得多。那么,生活在这样的未来会是什么样子?我想以四个短篇故事的形式,分享对这个未来的一些思考动因。

四个故事:智能、设计、科学与艺术

康斯坦丁·布勒: 第一个故事。19世纪中叶,美国想要为首任总统及最伟大的战争英雄 George Washington 建造一座宏伟的纪念碑。因此,我们设计了当时世界上最高的建筑——Washington National Monument,并且我们想要用世界上最珍贵的金属来装饰其顶端。当时 100 盎司的这种金属是世界上最珍贵的,珍贵到我们甚至将其放在 Manhattan 的 Tiffany’s 进行展览。那种金属就是铝。在 Washington National Monument 竣工后的几十年里,一位年轻的发明家发明了电解法,即从泥土中分离出铝的工艺。此后不久,铝便被用来包装糖果和三明治,然后被扔进垃圾桶。

帕特·格雷迪: 铝就是智能。电解法就是人工智能

康斯坦丁·布勒: 我们即将进入这样一个世界:一些耗费数十年光阴练就的、达到博士水平的宝贵技能,在调用后转瞬即逝,用完即可将其揉作一团直接扔进垃圾桶

第二个故事,我们正在进入一个异类设计的世界。我们今天所见的世界,其核心逻辑皆是为了人类而设计。众所周知,这种设计经过了优化,使之符合我们的大脑逻辑,因为世界上几乎所有的认知活动都是由我们完成的。然而,当认知活动由机器来完成时,情况将会大不相同。2006年,NASA 正在为一项大型航天任务,即卫星太空任务优化天线。传统上,他们的天线看起来是这样的。那是一种优美的几何对称图案,在一定的功率限制下优化了表面积。这一次,他们决定将任务交给计算机,并使用一种类似于强化学习的进化算法。

帕特·格雷迪: 结果就是眼前的这个天线。生产力显著提高,且不符合人类的直觉思维

康斯坦丁·布勒: 在这个 AI 时代,当我们把认知任务交给机器时,我们将得到的结果是不符合我们直觉的。

帕特·格雷迪: 当 AI 设计芯片、汽车和建筑物时,它们看起来可能会大相径庭。

康斯坦丁·布勒: 对于我们即将进入的世界,必须保持开放的心态,因为 AI 的思维方式与我们不同。它将具备异类的设计风格

第三个动力学故事关于新兴科学。并非新兴科学。我们都知道存在新兴科学。我所说的是新兴科学领域。在工业革命初期,涌现了像 Newcomen 和 Watt 这样伟大的工程师,他们完善了内燃机。简单来说,就是把石油化工产品注入活塞,点火燃烧,数百万乃至数十亿计的粒子发生爆炸。

帕特·格雷迪: 爆炸推动活塞,从而做功

康斯坦丁·布勒: 在近100年的时间里,这一切都处于修修补补的阶段。当时工程师只是在说,那样效果稍微好一点。或许你可以将其视为一种规模法则,但那实际上是工程师们在摆弄产品,看如何能进行微小的改进。在120多年后,Sadi Carnot 出现了,并将这一切总结为一门新的科学——热力学。

帕特·格雷迪: 他说,等一下,这里有数百万或数十亿的粒子。

康斯坦丁·布勒: 我们实际上可以将这一切系统化、公式化。而在当前的情况下,这里有数十亿个神经元,数万亿个 Token。此刻,我们正处于 AI 的修补阶段。即使我们认为这是一门已被认知的科学,事实并非如此。未来,我们将在接下来的几十年内迎来一门如热力学般基础的科学。在座的各位或许就有人能开创这门科学。而这门科学将被纳入高中的教学课程中。它将具有如此基础的地位。它将帮助我们掌握 AI,甚至帮助我们掌握意识。

第四个故事。非理性的艺术。在人类历史的绝大部分时间里,即数万年间,艺术一直朝着写实主义的方向演进。这是一幅大约 25000 年前的洞穴壁画。从埃及象形文字、希腊陶器到文艺复兴时期的画作,这是一场向写实艺术迈进的宏大变革。看看这其中的差异。历经数万年。人类的伟大胜利。

帕特·格雷迪: 随后工程技术应运而生。银版摄影法,早期摄影技术。

康斯坦丁·布勒: 突然之间,我们花费数十年人生去磨练、力求每一笔触都完美的技艺,瞬间消失了。那么世界对此作何反应?他们认为绘画艺术已经终结。噢,就这样结束了。机器能比任何人类做得更好。艺术即是艺术,艺术已终结。那么,发生了什么?人类是如何回应的?人类的回应是提出疑问:这种艺术的目的是什么?是为了以眼睛所见的方式捕捉那一刻吗?还是为了以内心和灵魂所感的方式捕捉那一刻?

帕特·格雷迪: 印象派、表现主义、立体主义、新表现主义,所有这些新的艺术形式都是人类对科学领域这一巨大变革所作出的回应

康斯坦丁·布勒: 两千五百年前,希腊哲学家 Protagoras 写道:人是万物的尺度。他的意思是,任何事物若脱离了人类,便不存在价值。无论是铝材、艺术,还是智能,皆是如此。

帕特·格雷迪: 它之所以有价值,仅仅是因为那份体验。AI 可以完成工作,AI 也终将完成工作,但唯有人与人之间的联结,才能让你找到在乎的理由

康斯坦丁·布勒: 这就是我们今天齐聚一堂的原因。十年之后,工作方式将发生巨大的变化。一切都将迎来翻天覆地的改变。但唯一不变的,是你们今天与身边人建立起的关系。它们将长久延续。那将是你们回首往事时最珍视的部分。那也将是今天最有价值的收获。因此,我鼓励大家与身边的人建立联系,尽情享受这次 AI Ascent 的时光,并真正地拥抱那些让我们之所以为人的特质