乐于分享
好东西不私藏

张小珺和苏煜聊Agent技术史、OpenClaw Moment

张小珺和苏煜聊Agent技术史、OpenClaw Moment

来源: 语言即世界工作室 / 张小珺商业访谈录
嘉宾: 苏煜(俄亥俄州立大学计算机教授,2025年“斯隆研究奖”获得者,Neocognition 创始人)
主持人: 张小珺
时长: 2h17min


核心论点

苏煜认为,AI Agent 正处于范式转变的拐点。通用智能(general intelligence)正在变得廉价和标配化,真正的差异化竞争力来自专业化智能(specializing intelligence)持续学习(continued learning)。他同时指出,中国在 AI 应用层的热情远超美国,而美国仍停留在开发者/技术圈层的叙事中。


逐节内容

1. 开场与嘉宾背景(00:00-02:00)

主持人介绍:苏煜是 OSU 计算机教授,研究方向为 language agent。创办 Neocognition 公司,聚焦 agent 研究。代表作包括 Mind2Web、CACT、LM Planner、MMMU 等早期 agent benchmark。

2. OpenClaw 的革命性意义(02:00-10:00)

  • OpenClaw 标志 Agent 范式变化,类比 ChatGPT 标志 LLM 范式变化
  • 两大变化: 交互形式变化:在 WhatsApp 等即时通讯软件中交互,24 小时 always on,有独立环境 Unaligned 路线:不管 permission/safety,所有能力全部打开释放
  • 深刻改变了科技公司的行为和技术路线:Anthropic Claude Code 跟进、OpenAI 全面转向 agent + productivity coding、NVIDIA 老黄称每个企业都需要 “Claude strategy”
  • 已经辐射到裁员新闻等社会层面

3. AI 发展史回顾(10:00-17:00)

  • Agent 不是新话题,贯穿 AI 始终
  • 经典教材:《Artificial Intelligence: A Modern Approach》
  • 两个主要阶段: Symbolic agent:基于规则和符号推理 Neural agent:深度强化学习(AlphaGo、Atari、Dota、星际争霸),但 autonomy 和 memory 都很受限
  • Agent 能力从三个维度分析:memory、computation、autonomy

4. 符号化与语言:人类智能的本质(17:00-26:00)

  • 人类感官不是最好的,但语言是独一无二的
  • 语言使信息能跨越时空和代际传递
  • Terence Deacon《The Symbolic Species》:符号和人类大脑是 co-evolution 的过程 先有了符号的 abstracted representation 反过来产生进化压力,让大脑产生相应变化 这相当于”自己开了一局新的游戏”,其他物种还在慢悠悠进化,Homo sapiens 开启了 Symbolic 新赛道 这个新赛道是自循环的,产生 cultural 进化压力

5. 嘉宾学术经历与创业动机(26:00-34:00)

  • 清华本科 → 美国 PhD → OSU 教授 → 搬来硅谷创办 Neocognition
  • 研究 group 做 agent 相关工作多年
  • 创业原因:在学校只能做 1-2 个事情,想同时做 10 个事情

6. Agent 能力评估:从 benchmark 到真实世界(34:00-42:00)

  • 嘉宾组做了很多 benchmark(如 MMMU),强调 construct validity / ecological validity
  • Benchmark 要评估的事情应该与 assistant 产生实际价值的效果高度正相关
  • 现在 agent 做任务的可靠性还不够,但已经能做很多事情
  • OpenClaw 让大众意识到 agent 已经”这么厉害了”

7. Specialization vs General Intelligence(42:00-49:00)

  • 核心观点:当通用智能变得廉价/标配时,differentiation 来自 specialization
  • 世界由几百万个小世界组成,每个职业、domain、公司、甚至每个软件都是一个小世界
  • 需要找到 differentiation,同时 credible + feasible + 团队是 best to do it + 有商业价值 + 大厂不能轻易 copy
  • Specializing intelligence 是现在最缺的

8. OpenClaw 对中国 vs 美国的影响差异(49:00-57:00)

  • 中国更加全民化:街头巷尾、各地政府都在推
  • 美国主要限于开发者群体:仍是开源项目叙事
  • 中国变成”时代性的产业机会”,甚至有”不学就要被淘汰”的焦虑感
  • 老人拿着电脑找年轻人帮忙装 OpenClaw
  • 中国在应用层动作一直很快(Google 前 CEO Eric Schmidt 也有类似洞察)

9. Agent 可靠性问题与边界条件(57:00-66:00)

  • 现在 agent 做任务时可靠性还不够
  • 非高度专业性问题 + 有必要的信息 → 60-70% 概率能做对
  • 需要更多的 specialization 来提升可靠性(speed、cost effectiveness)
  • 开源 vs 闭源的安全策略差异:开源项目释放后问题相对小,闭源要非常小心

10. Embodied Intelligence 具身智能(66:00-76:00)

  • VLA(Vision-Language-Action)技术路线
  • 想象空间大,但 uncertainty 非常高
  • 没人能 guarantee 自己的路线是对的
  • 在这种高想象空间 + 高不确定性的驱动下,大家会 “play some crazy bets”
  • 嘉宾个人偏好:all the way continued learning + all the way world modeling

11. Continued Learning 持续学习(76:00-85:00)

  • 经典问题:在学会新任务的同时,不要忘掉已有的任务(catastrophic forgetting)
  • 现在用法非常多样化:RL、post-training 都是 continued learning
  • 对个人而言最关键的 gap 是:学习的目标到底是什么
  • Continued learning 和 world modeling 是最根本的 bet

12. 语言作为文明基石(85:00-94:00)

  • 语言让人类能跨越时空和代际传递信息
  • Symbolic representation 是人类区别于其他物种的根本
  • 其他物种还在慢悠悠进化,Homo sapiens 开启了自循环的 Symbolic 赛道
  • 这个新赛道的进化压力是 cultural 层面的

13. Universal Digital Agent 终局思考(94:00-103:00)

  • 最终目标是 universal digital agent
  • Coding 不会消失:大脑是以 wide doorway 方式编码的
  • 但需要关注 specialization 方向的发展
  • 人机交互(HCI)研究显示很多有意思的模式

14. 2026 年 Agent 预期(103:00-111:00)

  • Specialization and becoming expert agent 是方向
  • 要达到可靠性、速度、成本效益
  • 最后达成结果之后,在可靠性上有更高的追求

15. 个人经历:从清华到 OSU(111:00-120:00)

  • 清华计算机本科,高考发挥不错
  • 在美国读 PhD,后来在 OSU 当老师
  • 开启 OSU OMP Group,做 agent 和 LM 相关研究

16. 为什么选择创业(120:00-128:00)

  • 在学校只能做 1-2 个事情,创业可以同时做 10 个事情
  • 这一代是最早做 agent 的这拨人,经历了完整周期
  • 从学校到创业,本质上原因相同:想做得更多

17. AI 取代知识工人的社会影响(128:00-134:00)

  • 真正的 concern:如果 AI agents 大规模取代 knowledge worker 不能产生足够多的新岗位去承接 displaced workforce 没有好的收益分配/再分配机制 大部分收益由头部公司或资本获得
  • 这会对社会产生极大的影响

18. 影响 AI 进程的关键论文 & Closing(134:00-137:48)

  • 关键论文
  • 1940s 神经元计算模型(最早用 computation 模拟 neuron)
  • Backpropagation(Hinton 大众化)
  • AlexNet 2012(神经网络文艺复兴)
  • Word2Vec 2013(重新引入 language processing)
  • Attention 机制 2014(两篇论文:seq2seq + machine translation)
  • Transformer 2017
  • BERT 2018(第一个大规模 foundation model for language)
  • GPT 系列 Chain of Thought
  • 个人信念:all the way continued learning + all the way world modeling
  • 工作室名称”语言即世界”非常好 —— that’s the truth, that’s my belief

金句

  • “Agent 贯穿 AI 的始终”
  • “当通用智能变得廉价时,differentiation 来自 specialization”
  • “阳光之下没有新鲜事”
  • “语言是独一无二的,这是导致我们文明和智能与众不同的根本原因”
  • “Homo sapiens 开启了 Symbolic 的新赛道,这个赛道是自循环的”
  • “中国更加全民化,美国仍限于开发者群体”
  • “真正的 concern 是 job displacement 和收益分配机制”