最近 AI 圈最火的不是什么大厂发布会,是一个叫 OpenClaw的开源项目。
它能做什么?简单说:你发一条消息,它帮你查邮件、订会议、整理文件、回复客户——像个不睡觉的私人助理,24小时在线。一上线就登顶 GitHub 全球热榜,有用户说第一次用完,"感觉世界又变了一次"。
但绝大多数人在惊叹它神奇的时候,没人去问一个更根本的问题——
这东西,为什么现在才出现?凭什么现在的 AI 能"干活"了?
AI 以前为什么"干不了活"?
用过早期 AI 的人大概都有过这种感受:你让它帮你安排今天的工作,它给你洋洋洒洒写一大段"建议",但就是不会真的帮你去操作。你让它查一件事,它"知道"的全是训练时学到的旧知识,查不了实时的信息。
原因说穿了其实很简单:以前的 AI 只会"想",不会"动"。
当时流行一种叫"思维链"的方法——让 AI 做题时把推理过程一步步写出来,"首先……其次……因此……",逻辑确实变清晰了,但它所有的知识都锁死在训练数据里。就像一个参加闭卷考试的书呆子,教材以外的事一问三不知,而且还会一本正经地胡说八道。
也有人反过来,给 AI 配上工具——搜索引擎、计算器、数据库——让它直接去执行动作。但问题是,它"手快脑慢",知道怎么查,不知道为什么查,查完也不知道下一步该干什么,像个没有方向感的实习生,容易原地打转。
一个只会想,一个只会动。这两条路,各有各的死胡同。
一篇论文,把这两条死胡同打通了
2023年,一个在普林斯顿念博士的中国年轻人,发表了一篇后来被无数人引用的论文。
论文的名字叫 ReAct,作者叫姚顺雨。
ReAct 的核心思路,说起来朴素得有点出乎意料——
让 AI 把"想"和"动"交织在一起:想一步、动一步、看结果、再想、再动。
用一个比喻来说,就像一个有经验的老侦探破案。他不会坐在家里把案子想完再出门,也不会毫无头绪地满城乱跑。他是这样的:
心里先想"凶器可能是刀"→ 去现场找证据 → 没找到,但发现了其他线索 → 调整判断:"也许凶器是绳子" → 再去找 → 找到了 → 再想下一步……
想和动交替进行,互相喂养,互相修正,一步步逼近真相。
这就是 ReAct:Reasoning(推理)+ Acting(行动),两件事同时发生,循环往复,直到任务完成。
来看一个论文里的真实案例——这是姚顺雨在论文中展示的 ReAct 实际运行过程,我把它翻译成中文:
问题:除了 Apple Remote,还有什么设备可以控制 Apple Remote 最初设计用来操作的那个程序?
🧠 想(Thought 1):我需要先搜索 Apple Remote,找到它最初被设计用来操作的程序是什么。
⚡ 动(Action 1):【搜索】Apple Remote
👀 看(Observation 1):Apple Remote 是苹果公司于 2005 年 10 月推出的遥控器,最初设计用来控制 Front Row 媒体中心程序……
🧠 想(Thought 2):Apple Remote 最初是用来控制 Front Row 这个程序的。我接下来需要搜索 Front Row,看看还有什么设备可以控制它。
⚡ 动(Action 2):【搜索】Front Row
👀 看(Observation 2):找不到 Front Row。相似词条:「Front Row Seat to Earth」「Front Row Motorsports」「Front Row(软件)」……
🧠 想(Thought 3):没找到,需要搜索更精确的词条「Front Row 软件」。
⚡ 动(Action 3):【搜索】Front Row 软件
👀 看(Observation 3):Front Row 是一款已停产的媒体中心软件,可以通过 Apple Remote 或键盘功能键控制……
🧠 想(Thought 4):Front Row 软件可以通过 Apple Remote 或键盘功能键控制。所以答案是键盘功能键。
✅ 最终回复:键盘功能键(Keyboard Function Keys)
注意看这个过程:第二步搜索没找到结果,AI 没有放弃、没有乱猜,而是看了观察结果之后,自己想出了"换个词再搜"的策略,然后找到了答案。
这就是"想-动-看"循环最关键的地方——它能处理意外,能在出错后自我修正。而这一点,是之前那些"只会想"或"只会动"的方法都做不到的。
这个思路,到底有多重要?
你可能会想:这不是很"显然"的事吗?边想边做,谁不会?
但在 2022 年之前,整个 AI 领域都没有把这件事做成一个通用框架,更没有人严格证明它的效果。
ReAct 论文一出,AI 在复杂推理任务上的成功率,比此前最好的方法提升了三到四成。这不是小修小补,是质变。论文投到了 AI 顶级学术会议 ICLR,拿到了"口头报告"——那是含金量最高的那一档,全场不到 5% 的论文才能入选。
但更大的意义不是数字,而是它打开的那扇门:
AI 不再只是一个"回答问题的机器",而是可以成为一个"替你完成任务的代理人"。
从一篇论文,到 OpenClaw
ReAct 之后,开发者们开始想:既然 AI 能"想一步、动一步、看结果再调整",那能不能让它替我管邮件?能不能替我安排日程?能不能帮我在网上查完资料、整理好、直接发出去?
于是一大批"AI Agent"工具陆续出现。
OpenClaw,就是这股浪潮里目前跑得最快的那一个。
它让任何人都能在自己的设备上,搭建一个真正替你"跑腿"的 AI 助手。它之所以能做到这些,底层逻辑正是"先想清楚要干什么、去执行、看结果、再调整"——和 ReAct 的框架一脉相承。
没有 ReAct 这类研究打下的地基,今天这批能真正"干活"的 AI 助手,根本站不起来。
顺便说说这个年轻人
姚顺雨,1998年生。高考704分入清华"姚班",普林斯顿博士,2024年加入 OpenAI。2025年底被腾讯挖走,出任首席 AI 科学家,向腾讯总裁刘炽平汇报。彼时,27岁。
他自己怎么看现在的 AI?他在一篇文章里写道:上半场打完了,下半场刚开始。
上半场,大家比谁的模型更大更强。下半场,要比的是 AI 能不能真正嵌入现实世界,把事情实实在在做完。
OpenClaw 的爆火,大概就是下半场开场哨响的声音。
参考来源
① 姚顺雨入职腾讯:南方网《27岁便掌舵腾讯核心部门,天才少年姚顺雨有何来历?》(2025年12月24日)
② ReAct 论文原文:Shunyu Yao et al.《ReAct: Synergizing Reasoning and Acting in Language Models》,发表于 ICLR 2023(arXiv 预印本首发于 2022 年 10 月,arXiv:2210.03629),https://arxiv.org/abs/2210.03629
③ OpenClaw 项目主页:https://openclaw.ai / GitHub: https://github.com/openclaw/openclaw
夜雨聆风