AI coding 和具身智能,正在走向同一个终点

这里是「AI 打工观察」。

我们不追每一个热搜，只观察一件事：AI 到底有没有真的开始干活。

上周 AI 圈的信息很多，但真正值得放进内容的，不是“又发布了一个模型”这种孤立事件。

更重要的变化是：AI 正在从工具，变成工作流里的执行者。

在代码世界，它开始接 issue、改代码、跑测试、做交付。

在物理世界，它开始进入巡检、物流、制造、康养这些真实场景。

在企业系统里，它开始被放进权限、合规、采购和组织流程。

所以这篇内容，我们还是围绕两条主线看：

AI coding 和智能体，能不能真的进入开发和企业工作流？

具身智能和机器人，能不能真的从 Demo 走向可采购、可部署、可复用？

先说结论

上周最明显的三个信号：

第一，AI coding 正在从个人工具进入企业基础设施。

GitHub、OpenAI、Anthropic、Google 都在抢同一个入口：开发者的任务流。

第二，国内具身智能进入“融资、订单、上市预期”同步升温阶段。

这说明行业不再只讲技术故事，资本和产业客户都开始追问交付能力。

第三，智能体竞争开始从“模型能力”转向“任务闭环”。

谁能理解目标、调用工具、处理异常、交付结果，谁才更接近真正的生产力工具。

01 国内 5 条

1. 摩尔线程把国产 GPU 往“AI 工作流底座”上推了一步

摩尔线程在 5 月 18 日前后集中展示了云端集群、终端芯片、边缘模组、具身智能仿真平台、MUSA 软件生态和 MUSACODE 编程助手等进展。报道中特别提到，MUSA 后端与 vLLM、SGLang 等主流推理链路的适配，正在把国产 GPU 从“能用”推向“好用”。

发生了什么

摩尔线程不再只讲硬件参数，而是把推理框架、开发工具、编程助手、具身智能仿真平台放进同一个生态叙事里。

为什么值得看

AI coding 和具身智能最后都会卡在工程链路上。模型再强，如果部署、推理、调试、算子迁移、端侧适配做不好，就很难进入真实生产环境。

我的判断

这类新闻不如机器人视频好传播，但更接近产业底层。AI 要真开始“打工”，需要的不只是模型，还需要一整套能跑起来、能维护、能降成本的基础设施。

2. 科创板 AI 公司集体参会，AI 商业化进入“收入兑现”阶段

5 月 20 日，科创板“十五五”主题集体业绩说明会之人工智能行业专场举行。36氪报道称，31 家科创板 AI 公司集体参会，讨论重点落在 AI 智能体规模化落地、产业收入兑现和商业化挑战上。

发生了什么

AI 公司的叙事从“技术领先”开始转向“收入、场景和持续交付”。资本市场不再只听模型参数和概念，更关心商业化结果。

为什么值得看

这对 AI 应用公司很关键。智能体如果只是演示，没有进入客户流程、没有产生收入，很难长期支撑估值。企业客户买的不是“聪明”，而是可衡量的效率提升。

我的判断

2026 年的 AI 公司会被迫回答一个更硬的问题：你到底替客户干了什么活？这对真正做应用、做交付、做行业 Know-how 的公司是机会，对只讲概念的公司是压力。

3. 人形机器人“六小龙”冲刺 IPO，具身智能进入资本验证期

36氪 5 月 21 日报道，人形机器人赛道头部公司正在被市场冠以“六小龙”IPO 的标签。报道提到，智元机器人、傅利叶智能、星动纪元等公司在融资、收入、交付和上市预期上都有明显动作。

发生了什么

具身智能从一级市场融资热，进一步走向 IPO 预期和二级市场检验。

为什么值得看

上市不是终点，但它会倒逼公司拿出更清晰的数据：收入、毛利、订单、交付能力、客户复购、研发投入。具身智能不能永远停留在“看起来很厉害”的演示阶段。

我的判断

这可能是国内具身智能从“融资叙事”进入“财务叙事”的开始。谁能把机器人卖出去、交付出去、维护起来，谁才有资格继续讲长期故事。

4. 国家电网 68 亿元机器人采购继续发酵，工业场景是具身智能的第一站

上周，国家电网计划年内采购约 8500 台具身智能设备、总投资约 68 亿元的消息继续在产业侧发酵。相关设备重点覆盖电力巡检、带电作业、应急救援和仓储物流等场景。

发生了什么

具身智能出现了更明确的大规模工业采购信号。它不是消费级陪伴机器人，而是面向高危、高重复、高标准化作业的设备采购。

为什么值得看

电力场景很适合具身智能先落地：需求明确，预算真实，场景相对标准化，而且危险作业天然有机器替人的动力。

我的判断

国内具身智能最先跑通的，大概率不是家庭机器人，而是 B 端场景。巡检、仓储、制造、应急这些地方，用户不会关心机器人像不像人，只关心它能不能稳定干活。

5. 百度 Create 2026 继续释放“智能体产品化”信号

百度 Create 2026 AI 开发者大会在 5 月中旬召开，上周仍在行业讨论中发酵。大会发布了通用智能体 DuMate、代码智能体秒哒 3.0、数字人智能体等产品，李彦宏提出 DAA，也就是“日活智能体数”。

发生了什么

百度试图把智能体从单点工具，推成一组产品矩阵，并用 DAA 给智能体时代找新的度量指标。

为什么值得看

代码智能体秒哒 3.0 值得单独关注。国内大厂开始把 AI coding 放进智能体产品线，而不是只做一个代码补全插件，这说明 AI coding 正在和企业应用、低代码、流程自动化合流。

我的判断

DAA 这个词有营销成分，但它抓到了一个真问题：未来 AI 应用的价值，不只是有多少用户打开了产品，而是有多少智能体真的在替用户完成任务。

02 国外 5 条

1. Google I/O 2026 把 Gemini 推向“agent everywhere”

5 月 19 日，Google I/O 2026 发布了一系列 AI 更新，包括 Gemini 3.5 Flash、Gemini Spark、Antigravity 2.0、Managed Agents API，以及面向开发者的 Gemini API 和 AI Studio 能力升级。Google 官方称，开发者工具正在从 prompt 走向 action。

发生了什么

Google 不只是更新模型，而是把 agent 能力塞进搜索、Gemini、Workspace、开发平台和 Antigravity 里。

为什么值得看

Google 的优势不是单个 AI coding 工具，而是生态入口。搜索、邮箱、文档、Android、云服务、IDE 工具链都在它手里。如果 agent 变成这些产品里的默认能力，影响会非常大。

我的判断

Google 这次释放的信号很明确：它想让 Gemini 不只是聊天入口，而是任务执行层。问题也很 Google：产品线太多，体验能不能收束成一个清晰入口，还要继续观察。

2. OpenAI Codex 更新：更像一个长期工程代理

OpenAI 5 月 21 日更新说明提到，Codex 增加了 Appshots、目标模式、浏览器标注改进和锁屏远程使用等能力。简单说，Codex 正在从“帮你写一段代码”变成“围绕目标持续推进任务”的工程代理。

发生了什么

Codex 的更新重点不只是生成代码，而是增强长任务、远程协作、浏览器环境理解和目标推进能力。

为什么值得看

AI coding 的竞争点正在变化。过去大家比补全和生成，现在开始比长任务、上下文接力、远程执行、结果验收和人机协作体验。

我的判断

真正影响开发效率的，不是 AI 能不能写出一段看起来不错的代码，而是它能不能少迷路、少打断人，把任务推进到可验收状态。Codex 这轮是在补工作流。

3. GitHub Copilot 企业版默认模型切到 GPT-5.3-Codex，LTS 模型成关键字

GitHub 宣布，从 2026 年 5 月 17 日起，GPT-5.3-Codex 成为 Copilot Business 和 Copilot Enterprise 的基础模型，替代 GPT-4.1。这个模型也是 GitHub 与 OpenAI 合作的首个长期支持模型。

发生了什么

GitHub Copilot 企业版把默认模型切到 GPT-5.3-Codex，并强调 LTS 长期支持。

为什么值得看

企业使用 AI coding 工具，不只看模型能力，还要看安全评估、合规流程、成本可控和版本稳定。LTS 模型出现，说明 AI coding 正在从尝鲜工具进入企业基础设施阶段。

我的判断

未来开发团队选 AI coding 模型，可能会越来越像选数据库、云服务和开发框架版本。不是最新就最好，而是要稳定、可控、能长期维护。

4. Anthropic 继续加码 Claude Code 和 Managed Agents

InfoQ 上内容道，Anthropic 在 Code with Claude 2026 上展示了 Claude Code、Claude Developer Platform、Managed Agents，以及和 GitHub、Vercel、Datadog、Bun 等伙伴的开发者场景。

发生了什么

Anthropic 继续把 Claude 放进开发者工作流，重点不是聊天，而是任务执行、代码修改、测试和工程协作。

为什么值得看

代码场景天然适合验证智能体价值。代码能不能跑、测试有没有过、PR 能不能合并，结果相对可验证。

我的判断

Claude Code 的口碑不是偶然。它抓住了开发者愿意付费的核心痛点：能不能真的理解项目、修改代码、跑测试、交付可审查的变更。接下来 OpenAI、GitHub、Anthropic 的竞争，会更像 IDE 入口和开发工作流之争。

5. Genesis AI 的 GENE-26.5 继续发酵，机器人竞争开始转向 brain 层

Genesis AI 5 月初发布 GENE-26.5，称其目标是让机器人获得更强的物理操作能力。上周这条信息仍在具身智能讨论中被反复提起，因为它把重点放在机器人“brain”上，而不是单纯强调本体硬件。

发生了什么

Genesis AI 试图用 GENE-26.5 证明，机器人需要的是能泛化到复杂物理任务的智能系统，而不只是能动的机械结构。

为什么值得看

具身智能的核心难点，正在从硬件演示转向泛化操作能力。机器人能不能在陌生任务里理解目标、规划动作、纠正错误，才是更大的问题。

我的判断

“机器人通用大脑”这种说法要保持警惕，容易包装过度。但方向没问题。硬件会逐步走向供应链竞争，真正难的是让机器人在真实世界里稳定完成任务。

03 本周主线判断

上周最值得看的，不是某家公司发了什么单点产品，而是 AI 的落地逻辑正在变。

过去，AI 产品主要证明自己“会生成”。

现在，它们开始证明自己“能完成”。

这就是 AI coding、智能体和具身智能值得放在一起观察的原因。

代码世界里，任务边界更清楚，结果更容易验证，所以 AI coding 会先跑起来。

物理世界里，变量更多，失败成本更高，所以具身智能会慢一些，但天花板也更高。

企业系统里，真正的门槛不是模型，而是权限、流程、合规、数据和责任边界。

一句话总结：

AI coding 是智能体最先规模化落地的练兵场，具身智能是它最终要面对的现实世界考场。

下周可以重点盯什么

1Google I/O 后，Antigravity、Gemini Spark 和 Managed Agents 的真实使用反馈；
2Codex 新功能在开发者社区里的评价，尤其是长任务和远程工作流；
3国内人形机器人公司是否继续释放订单、上市或量产信息；
4工业场景里，电力、仓储、制造是否出现更多具身智能采购信号；
5国内 AI 应用公司是否开始把“智能体收入”拆出来讲清楚。

写在最后

「AI 打工观察」会持续记录 AI 从“会回答问题”到“能接活干活”的过程。

我们重点关注三类信号：

1AI coding 和工程智能体，是否真的进入开发工作流；
2具身智能和机器人，是否真的进入可采购、可部署、可复用的场景；
3企业、开发者和产业链，是否开始为“AI 干活”重新设计流程。

如果你也关注 AI coding、智能体和具身智能，欢迎关注「AI 打工观察」。

不追每一个热点，只看 AI 有没有真的开始上班。