5月1日,AI真的去干活了-夜雨聆风

5月1日,AI真的去干活了

5 月 1 日最值得看的，不是哪家公司又发了一个更会聊天的模型，而是 AI 正在更明确地走向一个新位置：它开始变成能接任务、能进工具、能留下记录的工作层。

这一天的消息很散：Codex 有了更强的记忆线索，Claude 在做安全扫描和使用回顾，Cursor SDK 继续把编程助手平台化，Manus 推出云电脑，OpenAI 强化账户安全，Grok、Gemma、DeepSeek、NVIDIA 的模型消息也在同一天出现。把它们放在一起看，主线反而很清楚。

AI 正在从“帮你想一想”，变成“帮你跑一段流程”。这会改变开发者、产品团队和普通用户使用软件的方式。

Greg Brockman 提到 Codex 的 Chronicle 功能：它会记录用户在电脑上的操作，为 Codex 提供一种被动记忆。这个信号很重要。一个真正能干活的 AI，不能每次都像第一次见你一样，只靠当前对话猜上下文。

对开发者来说，记忆不是花哨功能，而是工作连续性的基础。它要知道你刚才改过什么、你怎么验证、你偏好什么命令、哪些坑不要再踩。没有这些，AI 就只能做一次性问答；有了这些，它才可能承接更长的任务。

同一天里，Claude Code 相关内容也很多。有人整理安全配置，提醒如何用 settings.json、deny rules、pre-commit hook 和容器隔离来防止敏感信息泄露；也有人传播 Claude Code 功能教程和课程。另一边，Cursor SDK、Zapier SDK、Browserbase /browser-trace 这类工具，都在补同一块能力：让 AI 能接入真实工具链，并且让它的行为可观察、可追踪、可复盘。

这说明编程 AI 的竞争已经不只在“谁补代码更准”。下一步更关键的是：谁能稳定地进入项目，理解上下文，调用工具，按流程交付，并且让人能审查它做了什么。

“云电脑”是给 AI 准备的工位

Manus 推出 Cloud Computer，看起来像一个普通的云端机器功能：电脑关了，任务还可以 24 小时运行；网页端和移动端都能用。

但放在 AI agent 的语境里，它其实更像一张工位。过去很多自动化任务卡在本地电脑：浏览器要开着、脚本要跑着、上下文不能丢、网络状态不能断。云电脑把这些东西放到一个常驻环境里，AI 就可以在里面持续构建、测试、运行和维护。

这也是为什么 OpenAI 被描述为进入“第三阶段”时，关键词不是单个产品，而是大规模工厂、全栈集成和新基础设施。AI 如果只是聊天窗口，不需要太多基础设施；AI 如果要连续干活，就需要运行环境、权限系统、审计日志、云端状态和失败恢复。

未来很多产品可能不会只提供一个“AI 按钮”，而是提供一套能让 AI 长时间工作的环境：任务队列、浏览器、文件系统、连接器、日志、人工确认和回滚。

模型竞争变成三条线

5 月 1 日的模型消息也很密集。

Grok 4.3 在 OpenRouter 上线，强调更低价格和更强的 agentic performance；Gemma 4 被拿来做离线编程和边缘设备优化；NVIDIA 展示多模态开源模型 Nemotron 3 Nano Omni，可以看屏幕、读文档、听音频、理解视频；DeepSeek-V4-Pro、Kimi K2、Grok Imagine 等消息则继续把模型能力、价格和应用场景往前推。

这些消息不再是同一场“谁分数最高”的比赛。更像三条线同时展开。

第一条线是更强的通用模型，负责复杂推理、代码和长任务。第二条线是更便宜、更开放、更容易接入的模型，让更多团队能把 AI 放进自己的产品。第三条线是本地、边缘和多模态模型，让 AI 不只在云端聊天，还能在设备上看、听、读、操作。

对创业团队来说，这意味着选模型会越来越像选基础设施。你不会只押一个入口，而是根据任务分配：强模型处理难题，小模型处理高频任务，本地模型处理隐私和低延迟，专用模型处理安全、代码或多媒体。

安全被推到台前

AI 越能干活，安全就越不能靠一句“请谨慎使用”糊弄过去。

OpenAI 推出 Advanced Account Security，面向高风险用户提供更强的账号保护，包括防钓鱼登录和更安全的账户恢复。Claude Security 进入公开测试，面向企业客户扫描代码库，查找漏洞并减少误报。AI Security Institute 的报告则提到，GPT-5.5 已经能端到端完成多步骤网络攻击模拟，在专家级网络任务上表现出明显能力。

这些事情放在一起看，结论很直接：AI 不只是提高效率，也会改变攻防两边的能力结构。

如果 AI 能读仓库、改代码、跑命令、访问 SaaS、操作账号，它就必须被放进更严肃的安全框架里。权限要分层，敏感数据要隔离，日志要完整，关键动作要有人确认，失败要能回滚。

这不是大公司的专属问题。小团队越依赖 AI，越要早一点把规则写清楚。否则效率提升得越快，事故半径也越大。

人不能把理解也外包掉

Karpathy 转发的那句话很适合给这一天收尾：你可以外包思考，但不能外包理解。

这句话不是反 AI。恰恰相反，它提醒我们怎么更成熟地用 AI。

当 AI 还只是帮你写一段文案、补一段代码时，不理解的代价可能只是质量差一点。可当 AI 开始接入工作流、调用工具、改动代码、扫描安全、操作云端环境时，人的角色就不能只剩下“点确认”。

真正需要提升的，是定义任务、设计边界、审查结果和理解系统的能力。AI 可以把很多中间步骤跑完，但你仍然要知道目标是什么，风险在哪里，结果是否可信。

所以 5 月 1 日这一天的主线可以压缩成一句话：

AI 正在从会聊天，走向会干活；从单点工具，走向工作系统；从炫技演示，走向需要被管理、审查和纳入生产的执行层。

接下来真正拉开差距的，不是收藏了多少 AI 工具，而是谁能把 AI 放进自己的真实流程里，让它稳定地产生结果。