5月3日,AI进公司干活了-夜雨聆风

5月3日,AI进公司干活了

5 月 3 日这批 AI 动向里，最值得看的不是某个新模型又刷了什么榜，而是一个更实际的变化：AI 正在离开单独的聊天窗口，进入企业系统、开发流程、视觉工作和安全边界。

过去我们问的是“这个模型聪不聪明”。现在更该问的是：它放在哪里？能不能接住一段真实工作？出了问题谁负责？

OpenAI 把 Codex 放进 AWS Bedrock，这件事的重点不是又多了一个入口，而是 AI 编程代理开始进入企业原有的基础设施。

很多大公司已经把数据、权限、流程和合规都放在 AWS 上。Codex 如果能直接出现在这些系统里，企业就不用先把团队迁移到一个新工具，再去谈 AI 编程。这场竞争会从“哪个工具体验最好”，变成“哪个工具已经在公司正在用的地方”。

Oracle 在 NetSuite SuiteCloud 里加入 AI 编程能力，也是同一个方向。会计、运营、业务管理员不一定会打开终端，也不一定会学 Python，但他们可能会通过 AI 修改工作流、生成自动化、发布业务逻辑。

真正的 AI 编程革命，未必只是让开发者写得更快。更大的变化是：更多非程序员开始拥有构建能力。

模型还是要更聪明

Sam Altman 提到一个很现实的权衡：他也希望模型更便宜、更快，但看起来“更聪明”仍然更重要。

这句话听起来朴素，却很关键。便宜和速度会决定一个能力能不能大规模使用，但如果模型不够聪明，很多流程根本无法交给它。尤其是代理任务，不是回答一句话，而是理解目标、判断下一步、处理异常、知道什么时候停下来。

Ilya Sutskever 那句“预测非常接近智能”也在这个背景下变得更清楚。生成式模型的核心赌注，是一个系统如果能压缩世界、预测下一步，就会逐渐形成可用的理解。

ARC-AGI 3 这类更复杂的测试，也在把模型推向同一个方向：不只是做题，而是在规则不明显、任务要推进、时间还有限的环境里表现出来。

Google DeepMind 的 Vision Banana 很有意思。它把分割、深度估计、3D 理解这些视觉任务，都改写成“生成一张可以被解码的图片”。

这其实是在把语言模型里的一个思路搬到视觉世界：用统一的生成任务，吃下更多不同类型的问题。结果也有信号意义，它在分割任务上击败 Segment Anything 3，在度量深度上接近 Depth Anything，同时还能保留图像生成能力。

同一天，xAI 的 Grok Imagine Agent Mode、Luma Labs 的营销视觉代理，也说明视觉生产正在从“生成一张图”，变成“生成一整套内容包”。短片、漫画页、营销素材、产品视觉，不再是单点输出，而是有目标、有连贯性的工作流。

这对内容团队很直接：未来竞争不只是会不会写提示词，而是谁能把视觉生产变成可重复的流程。

Agent 工具也在继续往前走。Anthropic 发布了 Claude 技能构建指南，Codex 0.128.0 加入 /goal，让代理能围绕一个目标跨多轮推进。vLLM Studio 也在做本地模型生命周期、运行时和 OpenAI 兼容代理。

这些变化说明 Agent 正在从演示阶段进入工程阶段。演示里，一个代理能跑通任务就够了；工程里，还要考虑目标如何保存、状态如何恢复、工具如何接入、失败如何回滚。

还有一个很细但重要的问题：多个代理之间交接时，前端 UI 怎么知道谁在接管？如果代理 A 渲染了界面，代理 B 接着处理任务，用户界面却不知道角色已经切换，就会出现体验和状态错乱。

这类问题不酷，但很真实。Agent 要进入产品，不只需要更强模型，也需要更稳的协议、界面和运行时。

今天最该警惕的部分来自安全。

Google 修复了 Gemini CLI 的一个 CVSS 10.0 漏洞：工具会盲目信任工作区文件，攻击者可以注入配置，在沙盒化之前触发远程代码执行。修复后需要显式信任设置，一些 CI/CD 流程可能会被影响。

Palo Alto Unit 42 的研究也给了同一个提醒。他们做了一个名为 Zealot 的多代理进攻安全 PoC，让 AI 代理在最少人工指导下串起云攻击链：SSRF、元数据凭证、服务账号冒充、BigQuery 数据外泄。

重点不是 AI 发明了新的攻击方式，而是它能把已有攻击路径用更快速度串起来。云环境本来就复杂、API 多、权限链长，一旦代理可以自动探索和推进，风险会被放大。

Figure F.03 机器人只靠机载摄像头感知，自主上下楼梯，并且是在仿真里用强化学习端到端训练出来的。这类进展说明 AI 不只在屏幕里接管流程，也在往物理世界推进。

Demis Hassabis 对 AGI 的说法也值得放在一起看：AGI 不一定是为了替代人类，而是探索什么才是真正通用的计算。这个判断听起来抽象，但落到今天这些例子里，其实很具体。

AI 正在进入企业系统，进入视觉生产，进入代码安全，进入机器人运动控制。它不是突然替代所有人，而是先接管一小段一小段工作。

5 月 3 日最值得记住的变化就是这个：AI 不再只是一个更会聊天的工具，它正在变成公司系统里的一层能力。机会在这里，风险也在这里。