5月1日,AI真的去干活了
5 月 1 日最值得看的,不是哪家公司又发了一个更会聊天的模型,而是 AI 正在更明确地走向一个新位置:它开始变成能接任务、能进工具、能留下记录的工作层。
这一天的消息很散:Codex 有了更强的记忆线索,Claude 在做安全扫描和使用回顾,Cursor SDK 继续把编程助手平台化,Manus 推出云电脑,OpenAI 强化账户安全,Grok、Gemma、DeepSeek、NVIDIA 的模型消息也在同一天出现。把它们放在一起看,主线反而很清楚。
AI 正在从“帮你想一想”,变成“帮你跑一段流程”。这会改变开发者、产品团队和普通用户使用软件的方式。

Greg Brockman 提到 Codex 的 Chronicle 功能:它会记录用户在电脑上的操作,为 Codex 提供一种被动记忆。这个信号很重要。一个真正能干活的 AI,不能每次都像第一次见你一样,只靠当前对话猜上下文。
对开发者来说,记忆不是花哨功能,而是工作连续性的基础。它要知道你刚才改过什么、你怎么验证、你偏好什么命令、哪些坑不要再踩。没有这些,AI 就只能做一次性问答;有了这些,它才可能承接更长的任务。
同一天里,Claude Code 相关内容也很多。有人整理安全配置,提醒如何用 settings.json、deny rules、pre-commit hook 和容器隔离来防止敏感信息泄露;也有人传播 Claude Code 功能教程和课程。另一边,Cursor SDK、Zapier SDK、Browserbase /browser-trace 这类工具,都在补同一块能力:让 AI 能接入真实工具链,并且让它的行为可观察、可追踪、可复盘。
这说明编程 AI 的竞争已经不只在“谁补代码更准”。下一步更关键的是:谁能稳定地进入项目,理解上下文,调用工具,按流程交付,并且让人能审查它做了什么。
“云电脑”是给 AI 准备的工位
Manus 推出 Cloud Computer,看起来像一个普通的云端机器功能:电脑关了,任务还可以 24 小时运行;网页端和移动端都能用。
但放在 AI agent 的语境里,它其实更像一张工位。过去很多自动化任务卡在本地电脑:浏览器要开着、脚本要跑着、上下文不能丢、网络状态不能断。云电脑把这些东西放到一个常驻环境里,AI 就可以在里面持续构建、测试、运行和维护。
这也是为什么 OpenAI 被描述为进入“第三阶段”时,关键词不是单个产品,而是大规模工厂、全栈集成和新基础设施。AI 如果只是聊天窗口,不需要太多基础设施;AI 如果要连续干活,就需要运行环境、权限系统、审计日志、云端状态和失败恢复。
未来很多产品可能不会只提供一个“AI 按钮”,而是提供一套能让 AI 长时间工作的环境:任务队列、浏览器、文件系统、连接器、日志、人工确认和回滚。
模型竞争变成三条线
5 月 1 日的模型消息也很密集。
Grok 4.3 在 OpenRouter 上线,强调更低价格和更强的 agentic performance;Gemma 4 被拿来做离线编程和边缘设备优化;NVIDIA 展示多模态开源模型 Nemotron 3 Nano Omni,可以看屏幕、读文档、听音频、理解视频;DeepSeek-V4-Pro、Kimi K2、Grok Imagine 等消息则继续把模型能力、价格和应用场景往前推。
这些消息不再是同一场“谁分数最高”的比赛。更像三条线同时展开。
第一条线是更强的通用模型,负责复杂推理、代码和长任务。第二条线是更便宜、更开放、更容易接入的模型,让更多团队能把 AI 放进自己的产品。第三条线是本地、边缘和多模态模型,让 AI 不只在云端聊天,还能在设备上看、听、读、操作。
对创业团队来说,这意味着选模型会越来越像选基础设施。你不会只押一个入口,而是根据任务分配:强模型处理难题,小模型处理高频任务,本地模型处理隐私和低延迟,专用模型处理安全、代码或多媒体。
安全被推到台前
AI 越能干活,安全就越不能靠一句“请谨慎使用”糊弄过去。
OpenAI 推出 Advanced Account Security,面向高风险用户提供更强的账号保护,包括防钓鱼登录和更安全的账户恢复。Claude Security 进入公开测试,面向企业客户扫描代码库,查找漏洞并减少误报。AI Security Institute 的报告则提到,GPT-5.5 已经能端到端完成多步骤网络攻击模拟,在专家级网络任务上表现出明显能力。
这些事情放在一起看,结论很直接:AI 不只是提高效率,也会改变攻防两边的能力结构。

如果 AI 能读仓库、改代码、跑命令、访问 SaaS、操作账号,它就必须被放进更严肃的安全框架里。权限要分层,敏感数据要隔离,日志要完整,关键动作要有人确认,失败要能回滚。
这不是大公司的专属问题。小团队越依赖 AI,越要早一点把规则写清楚。否则效率提升得越快,事故半径也越大。
人不能把理解也外包掉
Karpathy 转发的那句话很适合给这一天收尾:你可以外包思考,但不能外包理解。
这句话不是反 AI。恰恰相反,它提醒我们怎么更成熟地用 AI。
当 AI 还只是帮你写一段文案、补一段代码时,不理解的代价可能只是质量差一点。可当 AI 开始接入工作流、调用工具、改动代码、扫描安全、操作云端环境时,人的角色就不能只剩下“点确认”。
真正需要提升的,是定义任务、设计边界、审查结果和理解系统的能力。AI 可以把很多中间步骤跑完,但你仍然要知道目标是什么,风险在哪里,结果是否可信。
所以 5 月 1 日这一天的主线可以压缩成一句话:
AI 正在从会聊天,走向会干活;从单点工具,走向工作系统;从炫技演示,走向需要被管理、审查和纳入生产的执行层。
接下来真正拉开差距的,不是收藏了多少 AI 工具,而是谁能把 AI 放进自己的真实流程里,让它稳定地产生结果。
夜雨聆风