"我们放假,Jensen都不会注意到。"
—— Jim Fan,Nvidia AI总监
一个疯狂实验:给AI一堆机器人,让它自己教自己
Nvidia GEAR实验室最近做了一个实验:
把AI编码代理关进一个装满机械臂的实验室,给足算力和token预算,让它自己想办法训练机器人。
没有人类工程师盯着,没有预设训练脚本,只有一个目标:教会机器人安装GPU和剪扎带。
结果?
AI代理自己设计了一套训练方案,让机器人在反复试错中学会了这些精细操作。Nvidia的研究人员早上来实验室,直接看报告。
这到底怎么做到的?ENPIRE框架揭秘
这个实验背后的核心是一个叫 ENPIRE 的"代理 harness"(代理框架)。它不是AI模型本身,而是包裹在AI模型外面的一层软件,让AI能调用各种工具、记住经验、遵守约束、接受反馈。
ENPIRE有4个模块,像4个专职员工:
| 自动重置验证 | ||
| 策略优化 | ||
| 多机并行评估 | ||
| 失败分析改进 |
关键是:这4个模块全部由AI编码代理自动运行,不需要人类干预。
3种AI编码代理PK:谁教机器人教得最好?
Nvidia测试了3种主流AI编码代理,让它们独立开发训练方案:
1. OpenAI Codex(GPT-5.5)
- 优势
:代码生成能力强,策略设计逻辑清晰 - 表现
:训练方案稳定,成功率提升曲线平滑
2. Anthropic Claude Code(Opus 4.7)
- 优势
:上下文理解深,能从失败中快速总结规律 - 表现
:初期失败率高,但迭代速度快,后期反超
3. Moonshot Kimi Code(Kimi K2.6)
- 优势
:长文本处理能力强,能消化大量研究论文 - 表现
:策略设计更"学术",经常引用论文中的优化方法
结果:3种代理都成功了,但路径完全不同。
Codex像"稳健型投资者",稳扎稳打 Claude像"激进型创业者",快速试错迭代 Kimi像"学者型研究员",从论文找灵感
具体任务:安装GPU和剪扎带,有多难?
这两个任务听起来简单,但对机器人来说是地狱级难度:
安装GPU
GPU金手指要对准PCIe插槽,偏差1毫米就可能损坏 需要感知力度,太轻插不进去,太重会压弯主板 插槽两侧的卡扣要同时按下,需要双手协调
剪扎带
扎带位置不固定,机器人要先识别、再定位 剪刀角度要精确,剪断扎带但不能伤到线缆 剪断后还要清理碎片,不能留在设备里
这些任务的共同特点:需要"手感"和"微调",传统编程很难精确描述。
AI代理的做法是:让机器人自己试,试错了就分析原因,调整策略再试。
Jim Fan的"放假宣言":AI自我改进的时代来了?
Nvidia AI总监Jim Fan在LinkedIn上发了段话:
"我们Nvidia GEAR实验室的一部分现在夜间不知疲倦地自我改进。我们早上来读报告就行。"
"我们所有人放假,Jensen都不会注意到。"
这段话有两层含义:
第一层:技术突破AI编码代理已经能自主完成"设计实验→执行→分析→改进"的完整闭环。这不是"辅助编程",是"自主科研"。
第二层:劳动力冲击如果AI能自己训练机器人,那"机器人训练师"这个职业还存在吗?如果AI能自己写代码优化自己,那"AI工程师"的角色会变成什么?
更疯狂的是:即将开源,人人可搭建
Jim Fan说团队会开源一切,让任何人都能搭建自己的"自我运行机器人实验室"。
这意味着:
- 个人开发者
:可以在家里放几个机械臂,让AI自己教它们做咖啡、收拾桌面 - 小工厂
:不需要请专业的机器人工程师,AI自己优化产线 - 研究机构
:可以24小时运行实验,人类只需要早上看报告
"自我改进"不再是科技巨头的专利,即将民主化。
这对你意味着什么?
如果你是程序员
- 短期
:AI编码代理是你的"超级实习生",能帮你写测试、优化代码、分析日志 - 中期
:AI可能自己完成"需求分析→设计→编码→测试→部署"的完整流程 - 长期
:你的角色从"写代码"变成"定义问题"和"验证结果"
如果你是工程师
机器人训练可能从"手动调参"变成"设定目标,让AI自己优化" 你的价值从"操作技能"变成"系统设计"和"异常处理"
如果你是管理者
"24小时自我改进的实验室"可能成为标配 团队结构可能从"人+工具"变成"人+AI代理+机器人"
这是进步还是威胁?
支持方观点:
人类从重复劳动中解放,专注于创造性工作 机器人可以进入危险环境(核设施、太空),人类不用冒险 开源意味着技术民主化,小团队也能做大事
担忧方观点:
"我们放假Jensen都不会注意到"暗示大量岗位可能消失 AI自我改进的"黑箱"问题:如果AI走了弯路,人类怎么发现? 如果机器人训练机器人,出错的责任谁承担?
你怎么看?
评论区讨论 👇
如果这篇文章让你对AI的未来有了新的思考,可以点个赞。
或者转发给那个还在手动调参的同事,问问他:你的机器人训练师工作,还能干多久?
夜雨聆风