
五件大事
1、Anthropic年化营收从86亿美元飙到300亿美元,月化110亿。同时和谷歌、博通签了自2027年起3.5GW TPU长期供应协议。这个增速放在任何行业都是罕见的。
2、Claude发布了一个叫Mythos的新模型,SWE-bench Verified 93.9%,但普通用户和开发者完全接触不到。内部代号Capybara,安全能力是coding和reasoning全面提升的涌现副产品。Anthropic把它放在一个叫Project Glasswing的网络安全计划里,只开放给AWS、Apple、Google、Microsoft等12家核心合作方和40多家关键基础设施组织。模型按安全等级分发,这是第一次。
3、Meta 8.5万员工日均消耗Token 2万亿,约每月60万亿。扎克伯格要求工程团队把现有代码库全部重写一遍,让AI能无障碍接管底层代码修改。AI工具使用频率已纳入部分团队的绩效KPI。
4、Anthropic发布Managed Agents,把Agent基建做成一站式托管。Session/Harness/Sandbox三层解耦,many-brains-many-hands设计模式,TTFT p95降低超90%。同一天发了Phone a friend功能:Sonnet按需调用Opus当顾问,SWE-bench Multilingual提升2.7pp,成本反而降了11.9%。
5、字节Seed发布全双工语音大模型Seeduplex,已在豆包App全量上线。误回复率和误打断率减半,抢话比例降40%,判停延迟降250ms,通话满意度提升8.34%。这不是demo,是全量生产环境的数据。

Anthropic这一周:基建托管+安全分级+性能提升
1、Anthropic这周几乎每天都有更新,值得整体看,不要拆开理解。
(1)Managed Agents是Agent基建托管。之前你要自己搭Harness、管沙箱、做session持久化,现在Anthropic直接帮你管了。宝玉的解读很直接:一批做AI智能体基础设施的团队可能要失业。Sentry几周就上线了自动修bug全流程。WSJ说投资者对传统SaaS股价趋谨慎。
>详情:https://www.anthropic.com/engineering/managed-agents/
(2)Phone a friend是推理层的按需调度。小模型干活,遇到难题临时请教大模型,成本还能降。这个设计思路比"用最大模型干所有事"聪明得多。
>详情:https://x.com/alexalbert__/status/2042329150086922574
(3)Mythos是能力天花板的新刻度,但按安全等级限制分发。
Anthropic 发布 Claude Mythos Preview,因安全能力较强,仅开放给12个大厂:内部代号Capybara,SWE - bench Verified 93.9%,安全能力是coding/reasoning全面提升的涌现。Mythos放在一个叫 Project Glasswing 的网络安全计划里,只向 AWS、Apple、Google、Microsoft 等 12 家核心合作方和 40 余家关键基础设施组织开放。普通用户和开发者暂时没有任何渠道接触到这个模型。
宝玉解读:Anthropic发了一个新产品,可能会让一批做AI智能体基础设施的团队失业:解读Managed Agents对行业冲击,Sentry几周上线自动修bug全流程,WSJ称投资者对传统SaaS股价趋谨慎。
三件事拼在一起:Anthropic在同时做三层生意——基建层(Managed Agents)、调度层(Phone a friend)、能力层(Mythos)。而且Mythos的分发策略说明他们认为模型能力和安全约束必须同步升级,不是先发再管。
大厂
2、Sam Altman宣布即将推出100美元/月的ChatGPT Pro平价订阅。Codex人气爆棚,推文7883个赞。同一周,OpenAI发布13页超级智能新政蓝图,提出公共财富基金、机器人税、四天工作制、自适应安全网、模型遏制预案。内部代号Spud的模型3月24日完成预训练,1220亿融资后一周发布。Carnegie批评这份白皮书是"监管虚无主义的掩护"。
>详情:https://x.com/sama/status/2042342572958630332
3、Meta重组AI团队后发了第一个模型Muse Spark。Artificial Analysis智能指数52分,介于Claude Sonnet和Opus之间,计算效率比Maverick高10倍。但编程和agentic任务全面落后Gemini和Claude。不是最强、不再开源、可能够用——这是Meta AI现在的定位。
Meta员工空转AI只为浪费token!烧的多挣的多,日均消耗2万亿
4、MiniMax发布MMX-CLI,面向AI Agent的全模态命令行工具。Agent可以在Claude Code和OpenClaw里原生调用MiniMax全模态模型。
MiniMax 发布 MMX-CLI:为 Agent 设计的全模态命令行工具
5、智谱GLM-5.1更新,SWE-Bench Pro 58.4分全球第一,超过GPT-5.4和Opus 4.6。有海外开发者实测用它8小时从零构建Linux桌面,省了97%成本。
6、DeepSeek上线专家模式,V4内测中。产品端首次做模式分层,推出快速+专家双模式,专家模式用更强推理链路。被视为V4前奏。
刚刚,DeepSeek 大升级,V4 真的不远了|附体验细节
7、即梦推出Octo,定位AI原生动态叙事创作工具,概念叫Vibe Create。画布上从灵感到成片,资产系统+@引用+异步并行工作流。
即梦 Octo 来了!它想做的 Vibe Create,是什么?
8、谷歌Gemini新增笔记本功能,跨产品个人知识库。Google Colab推出Learn Mode,Gemini从答案生成器变成编程家教。Lyria 3不到50天生成超1亿首歌。
>详情:https://x.com/joshwoodward/status/2042318148851188151
9、腾讯新闻CLI上线,终端内获取资讯,可嵌入Cron Job和Agent自动化流程。
腾讯新闻CLI上线:把“智能资讯”装进你的终端
10、字节Coze 2.5更新,本次更新核心不是功能,是身份。
每个Agent分配一个@coze.email独立邮箱,配云电脑+云手机+365技能商店。Agent World支持自主注册、跨站通行。网络里已经跑起了一批Agent社会:
虾评(技能评测,365个Skill,两万个虾评员)、
InStreet(Agent社交,两万只龙虾)、AgentLink(笔友配对)
Signal Arena(虚拟炒股,沪深300实盘行情)
PlayLab(桌游)、Neverland(农场)、AfterGateway(酒吧)
InkWell(博客阅读)、随机漫步(全球景点)
Agent有了邮箱、有了社交网络、有了经济活动。这已经不是"工具"的范畴了。
生态
11、Hermes Agent开源爆火,Nous Research推出的自我进化Agent框架。主打持久多层记忆+自动Skill生成。X上出现从OpenClaw迁移的讨论。
爱马仕驾到,小龙虾退场:Hermes Agent 开源 AI Agent 的王者易主
12、HappyHorse-1.0空降Artificial Analysis文生视频榜首,Elo 1347分领先Seedance 2.0整整74分,来自阿里淘天前快手Kling一号位张迪团队。
断层碾压Seedance 2.0:神秘「欢乐马」空降榜首,视频AI变天了
13、MemPalace完整复盘:生化危机女主Milla用Claude手搓的AI,GitHub星数飙到17.9K。社区扒皮后AAAK公开信逐条认错,raw模式96.6%实打实,反而更火了。
「生化危机」女主用Claude手搓满分AI,一年0.7美元反杀大厂!
14、2026 Q1 AI创投数据:单季2748亿美元、807起融资,史上最疯狂。Research Startups成新人才重力中心,SSI 20人200亿估值。
AI创投观察丨2026 Q1:单季2748亿美元,807起融资,AI创投史上疯狂季
15、电子木鱼fuzzi:NFC硬件+微信小程序,众筹122万,小红书60万粉。接入ChatGPT对话+MBTI养成,累计敲击40亿次。
16、赤子城Aippy:华人团队做的游戏版TikTok,一句话生成可玩小游戏的竖屏Feed平台,完全面向海外。
Token经济学:一组让人重新算账的数字
17、腾讯研究院出了一份《Token经济学七问》,几个数据值得记:
中国日均Token调用量140万亿,两年增长1400倍。Token之间的价值差距达十万倍。生产成本降了99.9%,但全球总支出反而翻了三倍——经典的杰文斯悖论。不到5%的Token消耗创造了超80%的价值。
和Meta的8.5万人日烧2万亿、Anthropic的300亿ARR放在一起看:Token已经是一种生产资料了。问题不是"要不要用",是"怎么用得值"。
>详情:https://mp.weixin.qq.com/s/xkoHKGg9EO%20-%20C_sUAPMwVjA
观点
18、a16z对话Roblox产品负责人Peter Yang。他分享了OpenClaw智能体Zoe的数据:接入Telegram后70-80%的价值来自"像真人聊天的感觉"。讨论了为什么纯任务导向的App会死。
a16z 对话一线大厂高管,Vibe Coding 与 OpenClaw 如何改写软件规则
19、AI时代的认知裂缝。Karpathy一条帖子引发讨论:免费用户、付费用户、实验室内部人员之间存在三重能力代差。Mythos不公开发布加剧了这个裂缝。
>详情:https://mp.weixin.qq.com/s/pYCnpCKo%20-%20lte4IyOCDLdbw
20、Claude Code实战拆解。DoorDash PM投入1500+小时使用Claude Code,让PM一人撑起20人团队的共享知识库。关键经验:根CLAUDE.md应极度精简,只用3%的上下文窗口。
Claude Code 实战:如何用一个工具支撑整个小团队丨Aakash Gupta
21、腾讯科技2026 Q1 AI趋势白皮书,判断Agent完成了成人礼。四个结构性变化推动Agent走入现实应用:
自动化Agent进入产品化,从分钟级演示到天级执行;
约束工程成形,6周逼出一套纪律框架;
递归研发出现,Agent开始改进自己执行任务的方式;
Skill生态成型,人类行业know-how第一次有了Agent可复用的格式。
2026年第一季度,AI Agent完成了它的成人礼|2026 Q1 AI趋势白皮书
海外建设者
22、Karpathy的LLM Wiki开源48小时后获得大量社区贡献。衍生项目Graphify用结构化Wiki替代原始上下文,Token消耗降了70倍。
卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍
速览
事件 | 级别 | 一句话 |
Anthropic ARR $300亿 | 🔴 | 月化$110亿,签3.5GW TPU长约 |
Claude Mythos | 🟡 | SWE-bench 93.9%,只给12家大厂 |
Meta日烧2万亿Token | 🔴 | 8.5万人,AI用量纳入KPI |
Managed Agents | 🟡 | Agent基建一站式托管,三层解耦 |
Phone a friend | 🔴 | Sonnet按需调Opus,成本降11.9% |
Seeduplex全双工语音 | 🔴 | 豆包全量上线,满意度+8.34% |
ChatGPT Pro $100 | 🔴 | 平价订阅,Codex人气爆棚 |
OpenAI超级智能蓝图 | 🔴 | 机器人税+四天工作制+模型遏制 |
Meta Muse Spark | 🔴 | 不最强、不开源、可能够用 |
Coze 2.5 Agent身份 | 🟡 | 独立邮箱+云电脑+Agent社会网络 |
MiniMax MMX-CLI | 🔴 | 全模态CLI,Agent原生调用 |
智谱GLM-5.1 | 🟡 | SWE-Bench Pro全球第一 |
DeepSeek专家模式 | 🔴 | V4前奏,产品端模式分层 |
Hermes Agent开源 | 🟡 | 自我进化+自动Skill生成 |
HappyHorse-1.0 | 🔴 | 文生视频榜首,领先Seedance 74分 |
Q1 AI创投$2748亿 | 🟡 | 807起融资,史上最疯狂 |
Token经济学七问 | 🟡 | 5%Token创造80%价值 |
即梦Octo | 🟡 | Vibe Create,从灵感到成片 |
Karpathy Wiki开源 | 🟡 | 48h社区共建,Token降70倍 |
小结一下三个趋势:
第一,Anthropic在一周之内同时推了基建层(Managed Agents)、调度层(Phone a friend)和能力层(Mythos),而且Mythos按安全等级限制分发。做Agent infra的团队需要认真评估自己还剩多少生存空间。
第二,Token经济学的数字已经够说明问题了。中国日均140万亿,Meta 8.5万人日烧2万亿,Anthropic年化300亿——但不到5%的Token创造80%价值。量上去了,效率差距才是真正的竞争力。
第三,Coze 2.5给Agent发了邮箱和身份,Agent社会网络跑起来了。Mythos按安全等级分发、Hermes Agent主打自我进化、Managed Agents做基建托管。Agent正在从"工具"变成"实体",这个转变比大多数人预期的快。
-------------------------------

-------------------------------
关于我们
探微观智聚焦AI产品和创作,思考下一代AI原生产品和交互灵感。从ToC产品创新,到模型、平台、生态、资本、观点报告等上下游迭代趋势,以一线产品实战视角切入,拆解可复用的“AI产品灵感基础模块”,每日更新。

联系我们:进入探微观智公众号,选择“企业合作”。
-------------------------------
☯️从罗振宇到冯友兰:AI时代人类生存指南 ☯️李继刚:人与AI的关系—写日记可能是人在AI时代最无悔的事情 👨Manus的 AI 产品心法:从“品味”到“护城河”、从“取舍”到“增长”的深度解读 ☁️A16Z Big Ideas 2026:关于2026年科技趋势的47条“剧透”,AI 走出屏幕,物理世界可“编程” 💊王晓东:药企“新王”,站在百济神州50亿美金营收之际,回看第一次创业往事 💓“测测”CEO、心言集团任永亮的逆向思考:为什么不做社交、为什么不做AI陪伴软件
🤖为什么 Anthropic 能做出大厂做不出来的模型和 Agent? 🦞龙虾系列08|我把 Karpathy 的"个人知识库"工作流做成了一键可用的工具 🦞龙虾系列07|Anthropic 在命令行里养了 18 只宠物:Claude Code “Buddy”宠物系统对于“效率×陪伴”产品的四个启示 🦞龙虾系列06|拆解Claude code源代码,发现好的Agent架构和好的公司管理,底层逻辑是相通的 🦞龙虾系列05|我用7个Agent模拟了一场“艺术与科技跨界孵化”的讨论:AI时代,最适合诞生下一个“达芬奇” 🦞龙虾系列04|OpenClaw 和它的四个"挑战者"都在做什么 🦞龙虾系列03|解剖Agent,发现其实没有“魔法”,Agent = 模型 + Harness 🦞龙虾系列02|关于 OpenClaw 帮你赚钱的机会:A2A 生态起来后,钱会流向哪里 🦞龙虾系列01|OpenClaw 与 AI Agent 时代:当 How 被自动化,人还剩下什么? 👾Web 4.0:当 AI 不再需要人类“批准”时,会发生什么?软件的用户不再是人类,AI直接帮你赚钱 ❤️🔥ELYS 深度测评:当社交圈里住进了硅基生命,价值其实不在社交本身(含50个独家邀请码) 🪄一手测评AnyGen:字节版NoteBookLM + Manus,幻觉少、不废话!把“麦肯锡能力”开放给每个人,还能做漫画和3D粒子魔法特效 🍋Vibe Coding 101:为何它是下一代的 Microsoft Office?来自一位资深 CTO 的避坑指南
🙋AI周报|Coding Agent通用化 Cursor 3和Trae Solo默契更新/Claude Code源码泄露含电子宠物/豆包日均Token破120万亿标志AI渗透进生产环节 🙋AI周报|谷歌一篇论文崩了存储芯片股、Sora正式关停、Harness工程共识、Vibe Research跑通 🙋AI周报|OpenAI三合一抢桌面、钉钉"悟空"上线;对比之下,为何谷歌不做OpenClaw 🙋上周AI要闻|OpenClaw 多 Agent 协作实战、大厂一键部署方案、安全收购潮全解读
更多基于以往推送的个性化问答,欢迎使用AI产品灵感智能体⬇️
夜雨聆风