张小珺和苏煜聊Agent技术史、OpenClaw Moment
来源: 语言即世界工作室 / 张小珺商业访谈录
嘉宾: 苏煜(俄亥俄州立大学计算机教授,2025年“斯隆研究奖”获得者,Neocognition 创始人)
主持人: 张小珺
时长: 2h17min
核心论点
苏煜认为,AI Agent 正处于范式转变的拐点。通用智能(general intelligence)正在变得廉价和标配化,真正的差异化竞争力来自专业化智能(specializing intelligence)和持续学习(continued learning)。他同时指出,中国在 AI 应用层的热情远超美国,而美国仍停留在开发者/技术圈层的叙事中。
逐节内容
1. 开场与嘉宾背景(00:00-02:00)
主持人介绍:苏煜是 OSU 计算机教授,研究方向为 language agent。创办 Neocognition 公司,聚焦 agent 研究。代表作包括 Mind2Web、CACT、LM Planner、MMMU 等早期 agent benchmark。
2. OpenClaw 的革命性意义(02:00-10:00)
- OpenClaw 标志 Agent 范式变化,类比 ChatGPT 标志 LLM 范式变化
- 两大变化: 交互形式变化:在 WhatsApp 等即时通讯软件中交互,24 小时 always on,有独立环境 Unaligned 路线:不管 permission/safety,所有能力全部打开释放
- 深刻改变了科技公司的行为和技术路线:Anthropic Claude Code 跟进、OpenAI 全面转向 agent + productivity coding、NVIDIA 老黄称每个企业都需要 “Claude strategy”
- 已经辐射到裁员新闻等社会层面
3. AI 发展史回顾(10:00-17:00)
- Agent 不是新话题,贯穿 AI 始终
- 经典教材:《Artificial Intelligence: A Modern Approach》
- 两个主要阶段: Symbolic agent:基于规则和符号推理 Neural agent:深度强化学习(AlphaGo、Atari、Dota、星际争霸),但 autonomy 和 memory 都很受限
- Agent 能力从三个维度分析:memory、computation、autonomy
4. 符号化与语言:人类智能的本质(17:00-26:00)
- 人类感官不是最好的,但语言是独一无二的
- 语言使信息能跨越时空和代际传递
- Terence Deacon《The Symbolic Species》:符号和人类大脑是 co-evolution 的过程 先有了符号的 abstracted representation 反过来产生进化压力,让大脑产生相应变化 这相当于”自己开了一局新的游戏”,其他物种还在慢悠悠进化,Homo sapiens 开启了 Symbolic 新赛道 这个新赛道是自循环的,产生 cultural 进化压力
5. 嘉宾学术经历与创业动机(26:00-34:00)
- 清华本科 → 美国 PhD → OSU 教授 → 搬来硅谷创办 Neocognition
- 研究 group 做 agent 相关工作多年
- 创业原因:在学校只能做 1-2 个事情,想同时做 10 个事情
6. Agent 能力评估:从 benchmark 到真实世界(34:00-42:00)
- 嘉宾组做了很多 benchmark(如 MMMU),强调 construct validity / ecological validity
- Benchmark 要评估的事情应该与 assistant 产生实际价值的效果高度正相关
- 现在 agent 做任务的可靠性还不够,但已经能做很多事情
- OpenClaw 让大众意识到 agent 已经”这么厉害了”
7. Specialization vs General Intelligence(42:00-49:00)
- 核心观点:当通用智能变得廉价/标配时,differentiation 来自 specialization
- 世界由几百万个小世界组成,每个职业、domain、公司、甚至每个软件都是一个小世界
- 需要找到 differentiation,同时 credible + feasible + 团队是 best to do it + 有商业价值 + 大厂不能轻易 copy
- Specializing intelligence 是现在最缺的
8. OpenClaw 对中国 vs 美国的影响差异(49:00-57:00)
- 中国更加全民化:街头巷尾、各地政府都在推
- 美国主要限于开发者群体:仍是开源项目叙事
- 中国变成”时代性的产业机会”,甚至有”不学就要被淘汰”的焦虑感
- 老人拿着电脑找年轻人帮忙装 OpenClaw
- 中国在应用层动作一直很快(Google 前 CEO Eric Schmidt 也有类似洞察)
9. Agent 可靠性问题与边界条件(57:00-66:00)
- 现在 agent 做任务时可靠性还不够
- 非高度专业性问题 + 有必要的信息 → 60-70% 概率能做对
- 需要更多的 specialization 来提升可靠性(speed、cost effectiveness)
- 开源 vs 闭源的安全策略差异:开源项目释放后问题相对小,闭源要非常小心
10. Embodied Intelligence 具身智能(66:00-76:00)
- VLA(Vision-Language-Action)技术路线
- 想象空间大,但 uncertainty 非常高
- 没人能 guarantee 自己的路线是对的
- 在这种高想象空间 + 高不确定性的驱动下,大家会 “play some crazy bets”
- 嘉宾个人偏好:all the way continued learning + all the way world modeling
11. Continued Learning 持续学习(76:00-85:00)
- 经典问题:在学会新任务的同时,不要忘掉已有的任务(catastrophic forgetting)
- 现在用法非常多样化:RL、post-training 都是 continued learning
- 对个人而言最关键的 gap 是:学习的目标到底是什么
- Continued learning 和 world modeling 是最根本的 bet
12. 语言作为文明基石(85:00-94:00)
- 语言让人类能跨越时空和代际传递信息
- Symbolic representation 是人类区别于其他物种的根本
- 其他物种还在慢悠悠进化,Homo sapiens 开启了自循环的 Symbolic 赛道
- 这个新赛道的进化压力是 cultural 层面的
13. Universal Digital Agent 终局思考(94:00-103:00)
- 最终目标是 universal digital agent
- Coding 不会消失:大脑是以 wide doorway 方式编码的
- 但需要关注 specialization 方向的发展
- 人机交互(HCI)研究显示很多有意思的模式
14. 2026 年 Agent 预期(103:00-111:00)
- Specialization and becoming expert agent 是方向
- 要达到可靠性、速度、成本效益
- 最后达成结果之后,在可靠性上有更高的追求
15. 个人经历:从清华到 OSU(111:00-120:00)
- 清华计算机本科,高考发挥不错
- 在美国读 PhD,后来在 OSU 当老师
- 开启 OSU OMP Group,做 agent 和 LM 相关研究
16. 为什么选择创业(120:00-128:00)
- 在学校只能做 1-2 个事情,创业可以同时做 10 个事情
- 这一代是最早做 agent 的这拨人,经历了完整周期
- 从学校到创业,本质上原因相同:想做得更多
17. AI 取代知识工人的社会影响(128:00-134:00)
- 真正的 concern:如果 AI agents 大规模取代 knowledge worker 不能产生足够多的新岗位去承接 displaced workforce 没有好的收益分配/再分配机制 大部分收益由头部公司或资本获得
- 这会对社会产生极大的影响
18. 影响 AI 进程的关键论文 & Closing(134:00-137:48)
- 关键论文:
- 1940s 神经元计算模型(最早用 computation 模拟 neuron)
- Backpropagation(Hinton 大众化)
- AlexNet 2012(神经网络文艺复兴)
- Word2Vec 2013(重新引入 language processing)
- Attention 机制 2014(两篇论文:seq2seq + machine translation)
- Transformer 2017
- BERT 2018(第一个大规模 foundation model for language)
- GPT 系列 Chain of Thought
- 个人信念:all the way continued learning + all the way world modeling
- 工作室名称”语言即世界”非常好 —— that’s the truth, that’s my belief
金句
- “Agent 贯穿 AI 的始终”
- “当通用智能变得廉价时,differentiation 来自 specialization”
- “阳光之下没有新鲜事”
- “语言是独一无二的,这是导致我们文明和智能与众不同的根本原因”
- “Homo sapiens 开启了 Symbolic 的新赛道,这个赛道是自循环的”
- “中国更加全民化,美国仍限于开发者群体”
- “真正的 concern 是 job displacement 和收益分配机制”
夜雨聆风