AI周报|Anthropic 连续更新的一周、Claude Mythos只给12家大厂用/ Token经济学拐点/ Coze 2.5给Agent发身份证

五件大事

1、Anthropic年化营收从86亿美元飙到300亿美元，月化110亿。同时和谷歌、博通签了自2027年起3.5GW TPU长期供应协议。这个增速放在任何行业都是罕见的。

2、Claude发布了一个叫Mythos的新模型，SWE-bench Verified 93.9%，但普通用户和开发者完全接触不到。内部代号Capybara，安全能力是coding和reasoning全面提升的涌现副产品。Anthropic把它放在一个叫Project Glasswing的网络安全计划里，只开放给AWS、Apple、Google、Microsoft等12家核心合作方和40多家关键基础设施组织。模型按安全等级分发，这是第一次。

3、Meta 8.5万员工日均消耗Token 2万亿，约每月60万亿。扎克伯格要求工程团队把现有代码库全部重写一遍，让AI能无障碍接管底层代码修改。AI工具使用频率已纳入部分团队的绩效KPI。

4、Anthropic发布Managed Agents，把Agent基建做成一站式托管。Session/Harness/Sandbox三层解耦，many-brains-many-hands设计模式，TTFT p95降低超90%。同一天发了Phone a friend功能：Sonnet按需调用Opus当顾问，SWE-bench Multilingual提升2.7pp，成本反而降了11.9%。

5、字节Seed发布全双工语音大模型Seeduplex，已在豆包App全量上线。误回复率和误打断率减半，抢话比例降40%，判停延迟降250ms，通话满意度提升8.34%。这不是demo，是全量生产环境的数据。

扫码加入社群，快人一步获取行业前沿信息！

Anthropic这一周：基建托管+安全分级+性能提升

1、Anthropic这周几乎每天都有更新，值得整体看，不要拆开理解。

（1）Managed Agents是Agent基建托管。之前你要自己搭Harness、管沙箱、做session持久化，现在Anthropic直接帮你管了。宝玉的解读很直接：一批做AI智能体基础设施的团队可能要失业。Sentry几周就上线了自动修bug全流程。WSJ说投资者对传统SaaS股价趋谨慎。

>详情：https://www.anthropic.com/engineering/managed-agents/

（2）Phone a friend是推理层的按需调度。小模型干活，遇到难题临时请教大模型，成本还能降。这个设计思路比"用最大模型干所有事"聪明得多。

>详情：https://x.com/alexalbert__/status/2042329150086922574

（3）Mythos是能力天花板的新刻度，但按安全等级限制分发。

Anthropic 发布 Claude Mythos Preview，因安全能力较强，仅开放给12个大厂：内部代号Capybara，SWE - bench Verified 93.9%，安全能力是coding/reasoning全面提升的涌现。Mythos放在一个叫 Project Glasswing 的网络安全计划里，只向 AWS、Apple、Google、Microsoft 等 12 家核心合作方和 40 余家关键基础设施组织开放。普通用户和开发者暂时没有任何渠道接触到这个模型。
宝玉解读：Anthropic发了一个新产品，可能会让一批做AI智能体基础设施的团队失业：解读Managed Agents对行业冲击，Sentry几周上线自动修bug全流程，WSJ称投资者对传统SaaS股价趋谨慎。

三件事拼在一起：Anthropic在同时做三层生意——基建层（Managed Agents）、调度层（Phone a friend）、能力层（Mythos）。而且Mythos的分发策略说明他们认为模型能力和安全约束必须同步升级，不是先发再管。

大厂

2、Sam Altman宣布即将推出100美元/月的ChatGPT Pro平价订阅。Codex人气爆棚，推文7883个赞。同一周，OpenAI发布13页超级智能新政蓝图，提出公共财富基金、机器人税、四天工作制、自适应安全网、模型遏制预案。内部代号Spud的模型3月24日完成预训练，1220亿融资后一周发布。Carnegie批评这份白皮书是"监管虚无主义的掩护"。

>详情：https://x.com/sama/status/2042342572958630332

3、Meta重组AI团队后发了第一个模型Muse Spark。Artificial Analysis智能指数52分，介于Claude Sonnet和Opus之间，计算效率比Maverick高10倍。但编程和agentic任务全面落后Gemini和Claude。不是最强、不再开源、可能够用——这是Meta AI现在的定位。

Meta员工空转AI只为浪费token！烧的多挣的多，日均消耗2万亿

4、MiniMax发布MMX-CLI，面向AI Agent的全模态命令行工具。Agent可以在Claude Code和OpenClaw里原生调用MiniMax全模态模型。

MiniMax 发布 MMX-CLI：为 Agent 设计的全模态命令行工具

5、智谱GLM-5.1更新，SWE-Bench Pro 58.4分全球第一，超过GPT-5.4和Opus 4.6。有海外开发者实测用它8小时从零构建Linux桌面，省了97%成本。

有人把 Opus 4.6 换掉了，成本省了 97%

6、DeepSeek上线专家模式，V4内测中。产品端首次做模式分层，推出快速+专家双模式，专家模式用更强推理链路。被视为V4前奏。

刚刚，DeepSeek 大升级，V4 真的不远了｜附体验细节

7、即梦推出Octo，定位AI原生动态叙事创作工具，概念叫Vibe Create。画布上从灵感到成片，资产系统+@引用+异步并行工作流。

即梦 Octo 来了！它想做的 Vibe Create，是什么？

8、谷歌Gemini新增笔记本功能，跨产品个人知识库。Google Colab推出Learn Mode，Gemini从答案生成器变成编程家教。Lyria 3不到50天生成超1亿首歌。

>详情：https://x.com/joshwoodward/status/2042318148851188151

9、腾讯新闻CLI上线，终端内获取资讯，可嵌入Cron Job和Agent自动化流程。

腾讯新闻CLI上线：把“智能资讯”装进你的终端

Coze 2.5：给Agent发身份证

10、字节Coze 2.5更新，本次更新核心不是功能，是身份。

每个Agent分配一个@coze.email独立邮箱，配云电脑+云手机+365技能商店。Agent World支持自主注册、跨站通行。网络里已经跑起了一批Agent社会：

虾评（技能评测，365个Skill，两万个虾评员）、
InStreet（Agent社交，两万只龙虾）、AgentLink（笔友配对）
Signal Arena（虚拟炒股，沪深300实盘行情）
PlayLab（桌游）、Neverland（农场）、AfterGateway（酒吧）
InkWell（博客阅读）、随机漫步（全球景点）

Agent有了邮箱、有了社交网络、有了经济活动。这已经不是"工具"的范畴了。

Coze 2.5 发布：成为 Agent 的网络

生态

11、Hermes Agent开源爆火，Nous Research推出的自我进化Agent框架。主打持久多层记忆+自动Skill生成。X上出现从OpenClaw迁移的讨论。

爱马仕驾到，小龙虾退场：Hermes Agent 开源 AI Agent 的王者易主

12、HappyHorse-1.0空降Artificial Analysis文生视频榜首，Elo 1347分领先Seedance 2.0整整74分，来自阿里淘天前快手Kling一号位张迪团队。

断层碾压Seedance 2.0：神秘「欢乐马」空降榜首，视频AI变天了

13、MemPalace完整复盘：生化危机女主Milla用Claude手搓的AI，GitHub星数飙到17.9K。社区扒皮后AAAK公开信逐条认错，raw模式96.6%实打实，反而更火了。

「生化危机」女主用Claude手搓满分AI，一年0.7美元反杀大厂！

14、2026 Q1 AI创投数据：单季2748亿美元、807起融资，史上最疯狂。Research Startups成新人才重力中心，SSI 20人200亿估值。

AI创投观察丨2026 Q1：单季2748亿美元，807起融资，AI创投史上疯狂季

15、电子木鱼fuzzi：NFC硬件+微信小程序，众筹122万，小红书60万粉。接入ChatGPT对话+MBTI养成，累计敲击40亿次。

一个电子木鱼，靠AI，持续吸金

16、赤子城Aippy：华人团队做的游戏版TikTok，一句话生成可玩小游戏的竖屏Feed平台，完全面向海外。

这个华人团队，在海外做了一个「游戏版 TikTok」

Token经济学：一组让人重新算账的数字

17、腾讯研究院出了一份《Token经济学七问》，几个数据值得记：

中国日均Token调用量140万亿，两年增长1400倍。Token之间的价值差距达十万倍。生产成本降了99.9%，但全球总支出反而翻了三倍——经典的杰文斯悖论。不到5%的Token消耗创造了超80%的价值。

和Meta的8.5万人日烧2万亿、Anthropic的300亿ARR放在一起看：Token已经是一种生产资料了。问题不是"要不要用"，是"怎么用得值"。

>详情：https://mp.weixin.qq.com/s/xkoHKGg9EO%20-%20C_sUAPMwVjA

观点

18、a16z对话Roblox产品负责人Peter Yang。他分享了OpenClaw智能体Zoe的数据：接入Telegram后70-80%的价值来自"像真人聊天的感觉"。讨论了为什么纯任务导向的App会死。

a16z 对话一线大厂高管，Vibe Coding 与 OpenClaw 如何改写软件规则

19、AI时代的认知裂缝。Karpathy一条帖子引发讨论：免费用户、付费用户、实验室内部人员之间存在三重能力代差。Mythos不公开发布加剧了这个裂缝。

>详情：https://mp.weixin.qq.com/s/pYCnpCKo%20-%20lte4IyOCDLdbw

20、Claude Code实战拆解。DoorDash PM投入1500+小时使用Claude Code，让PM一人撑起20人团队的共享知识库。关键经验：根CLAUDE.md应极度精简，只用3%的上下文窗口。

Claude Code 实战：如何用一个工具支撑整个小团队丨Aakash Gupta

21、腾讯科技2026 Q1 AI趋势白皮书，判断Agent完成了成人礼。四个结构性变化推动Agent走入现实应用：

自动化Agent进入产品化，从分钟级演示到天级执行；
约束工程成形，6周逼出一套纪律框架；
递归研发出现，Agent开始改进自己执行任务的方式；
Skill生态成型，人类行业know-how第一次有了Agent可复用的格式。

2026年第一季度，AI Agent完成了它的成人礼｜2026 Q1 AI趋势白皮书

海外建设者

22、Karpathy的LLM Wiki开源48小时后获得大量社区贡献。衍生项目Graphify用结构化Wiki替代原始上下文，Token消耗降了70倍。

卡帕西没做完的，开源社区48小时搞定了！完全体知识库，token省70倍

速览

事件	级别	一句话
Anthropic ARR $300亿	🔴	月化$110亿，签3.5GW TPU长约
Claude Mythos	🟡	SWE-bench 93.9%，只给12家大厂
Meta日烧2万亿Token	🔴	8.5万人，AI用量纳入KPI
Managed Agents	🟡	Agent基建一站式托管，三层解耦
Phone a friend	🔴	Sonnet按需调Opus，成本降11.9%
Seeduplex全双工语音	🔴	豆包全量上线，满意度+8.34%
ChatGPT Pro $100	🔴	平价订阅，Codex人气爆棚
OpenAI超级智能蓝图	🔴	机器人税+四天工作制+模型遏制
Meta Muse Spark	🔴	不最强、不开源、可能够用
Coze 2.5 Agent身份	🟡	独立邮箱+云电脑+Agent社会网络
MiniMax MMX-CLI	🔴	全模态CLI，Agent原生调用
智谱GLM-5.1	🟡	SWE-Bench Pro全球第一
DeepSeek专家模式	🔴	V4前奏，产品端模式分层
Hermes Agent开源	🟡	自我进化+自动Skill生成
HappyHorse-1.0	🔴	文生视频榜首，领先Seedance 74分
Q1 AI创投$2748亿	🟡	807起融资，史上最疯狂
Token经济学七问	🟡	5%Token创造80%价值
即梦Octo	🟡	Vibe Create，从灵感到成片
Karpathy Wiki开源	🟡	48h社区共建，Token降70倍