5月3日,AI进公司干活了
5 月 3 日这批 AI 动向里,最值得看的不是某个新模型又刷了什么榜,而是一个更实际的变化:AI 正在离开单独的聊天窗口,进入企业系统、开发流程、视觉工作和安全边界。
过去我们问的是“这个模型聪不聪明”。现在更该问的是:它放在哪里?能不能接住一段真实工作?出了问题谁负责?
OpenAI 把 Codex 放进 AWS Bedrock,这件事的重点不是又多了一个入口,而是 AI 编程代理开始进入企业原有的基础设施。
很多大公司已经把数据、权限、流程和合规都放在 AWS 上。Codex 如果能直接出现在这些系统里,企业就不用先把团队迁移到一个新工具,再去谈 AI 编程。这场竞争会从“哪个工具体验最好”,变成“哪个工具已经在公司正在用的地方”。
Oracle 在 NetSuite SuiteCloud 里加入 AI 编程能力,也是同一个方向。会计、运营、业务管理员不一定会打开终端,也不一定会学 Python,但他们可能会通过 AI 修改工作流、生成自动化、发布业务逻辑。
真正的 AI 编程革命,未必只是让开发者写得更快。更大的变化是:更多非程序员开始拥有构建能力。

模型还是要更聪明
Sam Altman 提到一个很现实的权衡:他也希望模型更便宜、更快,但看起来“更聪明”仍然更重要。
这句话听起来朴素,却很关键。便宜和速度会决定一个能力能不能大规模使用,但如果模型不够聪明,很多流程根本无法交给它。尤其是代理任务,不是回答一句话,而是理解目标、判断下一步、处理异常、知道什么时候停下来。
Ilya Sutskever 那句“预测非常接近智能”也在这个背景下变得更清楚。生成式模型的核心赌注,是一个系统如果能压缩世界、预测下一步,就会逐渐形成可用的理解。
ARC-AGI 3 这类更复杂的测试,也在把模型推向同一个方向:不只是做题,而是在规则不明显、任务要推进、时间还有限的环境里表现出来。
视觉模型也在换思路
Google DeepMind 的 Vision Banana 很有意思。它把分割、深度估计、3D 理解这些视觉任务,都改写成“生成一张可以被解码的图片”。
这其实是在把语言模型里的一个思路搬到视觉世界:用统一的生成任务,吃下更多不同类型的问题。结果也有信号意义,它在分割任务上击败 Segment Anything 3,在度量深度上接近 Depth Anything,同时还能保留图像生成能力。
同一天,xAI 的 Grok Imagine Agent Mode、Luma Labs 的营销视觉代理,也说明视觉生产正在从“生成一张图”,变成“生成一整套内容包”。短片、漫画页、营销素材、产品视觉,不再是单点输出,而是有目标、有连贯性的工作流。
这对内容团队很直接:未来竞争不只是会不会写提示词,而是谁能把视觉生产变成可重复的流程。
Agent 生态开始暴露细节问题
Agent 工具也在继续往前走。Anthropic 发布了 Claude 技能构建指南,Codex 0.128.0 加入 /goal,让代理能围绕一个目标跨多轮推进。vLLM Studio 也在做本地模型生命周期、运行时和 OpenAI 兼容代理。
这些变化说明 Agent 正在从演示阶段进入工程阶段。演示里,一个代理能跑通任务就够了;工程里,还要考虑目标如何保存、状态如何恢复、工具如何接入、失败如何回滚。
还有一个很细但重要的问题:多个代理之间交接时,前端 UI 怎么知道谁在接管?如果代理 A 渲染了界面,代理 B 接着处理任务,用户界面却不知道角色已经切换,就会出现体验和状态错乱。
这类问题不酷,但很真实。Agent 要进入产品,不只需要更强模型,也需要更稳的协议、界面和运行时。
安全边界会被重新计算
今天最该警惕的部分来自安全。
Google 修复了 Gemini CLI 的一个 CVSS 10.0 漏洞:工具会盲目信任工作区文件,攻击者可以注入配置,在沙盒化之前触发远程代码执行。修复后需要显式信任设置,一些 CI/CD 流程可能会被影响。
Palo Alto Unit 42 的研究也给了同一个提醒。他们做了一个名为 Zealot 的多代理进攻安全 PoC,让 AI 代理在最少人工指导下串起云攻击链:SSRF、元数据凭证、服务账号冒充、BigQuery 数据外泄。
重点不是 AI 发明了新的攻击方式,而是它能把已有攻击路径用更快速度串起来。云环境本来就复杂、API 多、权限链长,一旦代理可以自动探索和推进,风险会被放大。

现实世界也在靠近
Figure F.03 机器人只靠机载摄像头感知,自主上下楼梯,并且是在仿真里用强化学习端到端训练出来的。这类进展说明 AI 不只在屏幕里接管流程,也在往物理世界推进。
Demis Hassabis 对 AGI 的说法也值得放在一起看:AGI 不一定是为了替代人类,而是探索什么才是真正通用的计算。这个判断听起来抽象,但落到今天这些例子里,其实很具体。
AI 正在进入企业系统,进入视觉生产,进入代码安全,进入机器人运动控制。它不是突然替代所有人,而是先接管一小段一小段工作。
5 月 3 日最值得记住的变化就是这个:AI 不再只是一个更会聊天的工具,它正在变成公司系统里的一层能力。机会在这里,风险也在这里。
夜雨聆风