这里是「AI 打工观察」。
我们不追每一个热搜,只观察一件事:AI 到底有没有真的开始干活。
上周 AI 圈的信息很多,但真正值得放进内容的,不是“又发布了一个模型”这种孤立事件。
更重要的变化是:AI 正在从工具,变成工作流里的执行者。
在代码世界,它开始接 issue、改代码、跑测试、做交付。
在物理世界,它开始进入巡检、物流、制造、康养这些真实场景。
在企业系统里,它开始被放进权限、合规、采购和组织流程。
所以这篇内容,我们还是围绕两条主线看:
AI coding 和智能体,能不能真的进入开发和企业工作流?
具身智能和机器人,能不能真的从 Demo 走向可采购、可部署、可复用?
先说结论
上周最明显的三个信号:
第一,AI coding 正在从个人工具进入企业基础设施。
GitHub、OpenAI、Anthropic、Google 都在抢同一个入口:开发者的任务流。
第二,国内具身智能进入“融资、订单、上市预期”同步升温阶段。
这说明行业不再只讲技术故事,资本和产业客户都开始追问交付能力。
第三,智能体竞争开始从“模型能力”转向“任务闭环”。
谁能理解目标、调用工具、处理异常、交付结果,谁才更接近真正的生产力工具。
01 国内 5 条
1. 摩尔线程把国产 GPU 往“AI 工作流底座”上推了一步
摩尔线程在 5 月 18 日前后集中展示了云端集群、终端芯片、边缘模组、具身智能仿真平台、MUSA 软件生态和 MUSACODE 编程助手等进展。报道中特别提到,MUSA 后端与 vLLM、SGLang 等主流推理链路的适配,正在把国产 GPU 从“能用”推向“好用”。
发生了什么
摩尔线程不再只讲硬件参数,而是把推理框架、开发工具、编程助手、具身智能仿真平台放进同一个生态叙事里。
为什么值得看
AI coding 和具身智能最后都会卡在工程链路上。模型再强,如果部署、推理、调试、算子迁移、端侧适配做不好,就很难进入真实生产环境。
我的判断
这类新闻不如机器人视频好传播,但更接近产业底层。AI 要真开始“打工”,需要的不只是模型,还需要一整套能跑起来、能维护、能降成本的基础设施。
2. 科创板 AI 公司集体参会,AI 商业化进入“收入兑现”阶段
5 月 20 日,科创板“十五五”主题集体业绩说明会之人工智能行业专场举行。36氪报道称,31 家科创板 AI 公司集体参会,讨论重点落在 AI 智能体规模化落地、产业收入兑现和商业化挑战上。
发生了什么
AI 公司的叙事从“技术领先”开始转向“收入、场景和持续交付”。资本市场不再只听模型参数和概念,更关心商业化结果。
为什么值得看
这对 AI 应用公司很关键。智能体如果只是演示,没有进入客户流程、没有产生收入,很难长期支撑估值。企业客户买的不是“聪明”,而是可衡量的效率提升。
我的判断
2026 年的 AI 公司会被迫回答一个更硬的问题:你到底替客户干了什么活?这对真正做应用、做交付、做行业 Know-how 的公司是机会,对只讲概念的公司是压力。
3. 人形机器人“六小龙”冲刺 IPO,具身智能进入资本验证期
36氪 5 月 21 日报道,人形机器人赛道头部公司正在被市场冠以“六小龙”IPO 的标签。报道提到,智元机器人、傅利叶智能、星动纪元等公司在融资、收入、交付和上市预期上都有明显动作。
发生了什么
具身智能从一级市场融资热,进一步走向 IPO 预期和二级市场检验。
为什么值得看
上市不是终点,但它会倒逼公司拿出更清晰的数据:收入、毛利、订单、交付能力、客户复购、研发投入。具身智能不能永远停留在“看起来很厉害”的演示阶段。
我的判断
这可能是国内具身智能从“融资叙事”进入“财务叙事”的开始。谁能把机器人卖出去、交付出去、维护起来,谁才有资格继续讲长期故事。
4. 国家电网 68 亿元机器人采购继续发酵,工业场景是具身智能的第一站
上周,国家电网计划年内采购约 8500 台具身智能设备、总投资约 68 亿元的消息继续在产业侧发酵。相关设备重点覆盖电力巡检、带电作业、应急救援和仓储物流等场景。
发生了什么
具身智能出现了更明确的大规模工业采购信号。它不是消费级陪伴机器人,而是面向高危、高重复、高标准化作业的设备采购。
为什么值得看
电力场景很适合具身智能先落地:需求明确,预算真实,场景相对标准化,而且危险作业天然有机器替人的动力。
我的判断
国内具身智能最先跑通的,大概率不是家庭机器人,而是 B 端场景。巡检、仓储、制造、应急这些地方,用户不会关心机器人像不像人,只关心它能不能稳定干活。
5. 百度 Create 2026 继续释放“智能体产品化”信号
百度 Create 2026 AI 开发者大会在 5 月中旬召开,上周仍在行业讨论中发酵。大会发布了通用智能体 DuMate、代码智能体秒哒 3.0、数字人智能体等产品,李彦宏提出 DAA,也就是“日活智能体数”。
发生了什么
百度试图把智能体从单点工具,推成一组产品矩阵,并用 DAA 给智能体时代找新的度量指标。
为什么值得看
代码智能体秒哒 3.0 值得单独关注。国内大厂开始把 AI coding 放进智能体产品线,而不是只做一个代码补全插件,这说明 AI coding 正在和企业应用、低代码、流程自动化合流。
我的判断
DAA 这个词有营销成分,但它抓到了一个真问题:未来 AI 应用的价值,不只是有多少用户打开了产品,而是有多少智能体真的在替用户完成任务。
02 国外 5 条
1. Google I/O 2026 把 Gemini 推向“agent everywhere”
5 月 19 日,Google I/O 2026 发布了一系列 AI 更新,包括 Gemini 3.5 Flash、Gemini Spark、Antigravity 2.0、Managed Agents API,以及面向开发者的 Gemini API 和 AI Studio 能力升级。Google 官方称,开发者工具正在从 prompt 走向 action。
发生了什么
Google 不只是更新模型,而是把 agent 能力塞进搜索、Gemini、Workspace、开发平台和 Antigravity 里。
为什么值得看
Google 的优势不是单个 AI coding 工具,而是生态入口。搜索、邮箱、文档、Android、云服务、IDE 工具链都在它手里。如果 agent 变成这些产品里的默认能力,影响会非常大。
我的判断
Google 这次释放的信号很明确:它想让 Gemini 不只是聊天入口,而是任务执行层。问题也很 Google:产品线太多,体验能不能收束成一个清晰入口,还要继续观察。
2. OpenAI Codex 更新:更像一个长期工程代理
OpenAI 5 月 21 日更新说明提到,Codex 增加了 Appshots、目标模式、浏览器标注改进和锁屏远程使用等能力。简单说,Codex 正在从“帮你写一段代码”变成“围绕目标持续推进任务”的工程代理。
发生了什么
Codex 的更新重点不只是生成代码,而是增强长任务、远程协作、浏览器环境理解和目标推进能力。
为什么值得看
AI coding 的竞争点正在变化。过去大家比补全和生成,现在开始比长任务、上下文接力、远程执行、结果验收和人机协作体验。
我的判断
真正影响开发效率的,不是 AI 能不能写出一段看起来不错的代码,而是它能不能少迷路、少打断人,把任务推进到可验收状态。Codex 这轮是在补工作流。
3. GitHub Copilot 企业版默认模型切到 GPT-5.3-Codex,LTS 模型成关键字
GitHub 宣布,从 2026 年 5 月 17 日起,GPT-5.3-Codex 成为 Copilot Business 和 Copilot Enterprise 的基础模型,替代 GPT-4.1。这个模型也是 GitHub 与 OpenAI 合作的首个长期支持模型。
发生了什么
GitHub Copilot 企业版把默认模型切到 GPT-5.3-Codex,并强调 LTS 长期支持。
为什么值得看
企业使用 AI coding 工具,不只看模型能力,还要看安全评估、合规流程、成本可控和版本稳定。LTS 模型出现,说明 AI coding 正在从尝鲜工具进入企业基础设施阶段。
我的判断
未来开发团队选 AI coding 模型,可能会越来越像选数据库、云服务和开发框架版本。不是最新就最好,而是要稳定、可控、能长期维护。
4. Anthropic 继续加码 Claude Code 和 Managed Agents
InfoQ 上内容道,Anthropic 在 Code with Claude 2026 上展示了 Claude Code、Claude Developer Platform、Managed Agents,以及和 GitHub、Vercel、Datadog、Bun 等伙伴的开发者场景。
发生了什么
Anthropic 继续把 Claude 放进开发者工作流,重点不是聊天,而是任务执行、代码修改、测试和工程协作。
为什么值得看
代码场景天然适合验证智能体价值。代码能不能跑、测试有没有过、PR 能不能合并,结果相对可验证。
我的判断
Claude Code 的口碑不是偶然。它抓住了开发者愿意付费的核心痛点:能不能真的理解项目、修改代码、跑测试、交付可审查的变更。接下来 OpenAI、GitHub、Anthropic 的竞争,会更像 IDE 入口和开发工作流之争。
5. Genesis AI 的 GENE-26.5 继续发酵,机器人竞争开始转向 brain 层
Genesis AI 5 月初发布 GENE-26.5,称其目标是让机器人获得更强的物理操作能力。上周这条信息仍在具身智能讨论中被反复提起,因为它把重点放在机器人“brain”上,而不是单纯强调本体硬件。
发生了什么
Genesis AI 试图用 GENE-26.5 证明,机器人需要的是能泛化到复杂物理任务的智能系统,而不只是能动的机械结构。
为什么值得看
具身智能的核心难点,正在从硬件演示转向泛化操作能力。机器人能不能在陌生任务里理解目标、规划动作、纠正错误,才是更大的问题。
我的判断
“机器人通用大脑”这种说法要保持警惕,容易包装过度。但方向没问题。硬件会逐步走向供应链竞争,真正难的是让机器人在真实世界里稳定完成任务。
03 本周主线判断
上周最值得看的,不是某家公司发了什么单点产品,而是 AI 的落地逻辑正在变。
过去,AI 产品主要证明自己“会生成”。
现在,它们开始证明自己“能完成”。
这就是 AI coding、智能体和具身智能值得放在一起观察的原因。
代码世界里,任务边界更清楚,结果更容易验证,所以 AI coding 会先跑起来。
物理世界里,变量更多,失败成本更高,所以具身智能会慢一些,但天花板也更高。
企业系统里,真正的门槛不是模型,而是权限、流程、合规、数据和责任边界。
一句话总结:
AI coding 是智能体最先规模化落地的练兵场,具身智能是它最终要面对的现实世界考场。
下周可以重点盯什么
- 1Google I/O 后,Antigravity、Gemini Spark 和 Managed Agents 的真实使用反馈;
- 2Codex 新功能在开发者社区里的评价,尤其是长任务和远程工作流;
- 3国内人形机器人公司是否继续释放订单、上市或量产信息;
- 4工业场景里,电力、仓储、制造是否出现更多具身智能采购信号;
- 5国内 AI 应用公司是否开始把“智能体收入”拆出来讲清楚。
写在最后
「AI 打工观察」会持续记录 AI 从“会回答问题”到“能接活干活”的过程。
我们重点关注三类信号:
- 1AI coding 和工程智能体,是否真的进入开发工作流;
- 2具身智能和机器人,是否真的进入可采购、可部署、可复用的场景;
- 3企业、开发者和产业链,是否开始为“AI 干活”重新设计流程。
如果你也关注 AI coding、智能体和具身智能,欢迎关注「AI 打工观察」。
不追每一个热点,只看 AI 有没有真的开始上班。
夜雨聆风