
本周三个变化入口
① Karpathy加入Anthropic,AI人才牌局重洗
OpenAI第11位创始成员Andrej Karpathy5月19日官宣加入Anthropic预训练团队,将组建新团队主攻递归自我改进(RSI)方向。OpenAI原始11人创始团队仅剩2人。同一周,Anthropic刚以9000亿美元估值完成300亿美元融资,Karpathy的加入被视为Anthropic IPO前的关键人事布局。
② 豆包C端订阅上线、腾讯云模型公测结束:中国大模型告别免费午餐
5月4日豆包推出三档付费订阅(68/200/500元/月),登上微博热搜第一;5月19日腾讯云智能体开发平台宣布Hy3 preview和DeepSeek-V4-Pro结束限时免费公测,5月27日起按量计费。令人意外的是,转为收费后腾讯云平台周调用量反涨210%。中国大模型走过"烧钱换增长",正式进入"找商业模式"阶段。
③ 谷歌I/O 2026:Gemini 3.5 Flash + Spark智能体 + AI眼镜
5月20日凌晨谷歌I/O大会发布多款重磅产品:Gemini 3.5 Flash输出速度为前沿模型4倍、成本不到一半;Gemini Omni世界模型支持任意输入生成任意输出;Gemini Spark为7x24小时在线个人AI助手;还首度曝光了AI智能眼镜。Gemini月处理Token超3200万亿,月活9亿。
大模型进展
Musk诉OpenAI案败诉,OpenAI扫清IPO障碍
加州9人陪审团一致裁定Musk诉讼超过诉讼时效,法官当庭表示有充分证据支持裁决。此案终结意味着OpenAI重组之路上一大法律威胁解除,为其传闻中的IPO扫清关键障碍。
Anthropic收购Stainless,打通MCP生态关键一环
5月18日Anthropic宣布收购SDK工具公司Stainless。Stainless为数百家公司生成SDK、CLI和MCP服务器,覆盖TypeScript/Python/Go/Java等语言。Anthropic表示此举将推进Claude平台的Agent连接能力,让智能体能触达更多工具和数据源。
Mistral AI收购Emmi AI,发力工业工程场景
欧洲AI领军企业Mistral收购奥地利工程AI公司Emmi AI,后者专注开发工业物理AI模型,加速工业仿真和工程工作流,覆盖能源、汽车、半导体和航空航天。收购后Linz将成为Mistral官方办公室,标志着欧洲工业AI版图加速整合。
OpenAI采纳Google SynthID水印,AI内容溯源基础设施建设提速
OpenAI宣布采用Google的SynthID不可见水印技术,用于标识AI生成图片,并发布验证工具。同一周,GitHub上一个移除AI水印的开源工具获得109分热议。水印攻防战正在成为AI治理的新前线。
Agora-1:首个多智能体世界模型发布
Odyssey发布Agora-1,首次实现多个参与者(人类或AI)在同一世界模拟中实时共享交互。此前世界模型仅支持单参与者,Agora-1允许最多4名玩家在同一个生成式世界中实时互动,被视为"学习型游戏引擎"的概念验证。
Forge框架:8B小模型+Guardrails=99% Agent任务完成率
Show HN项目Forge通过Guardrails(解析救援、重试引导、步骤强制)和上下文管理,将8B本地模型在Agent任务上的完成率从53%提升到99%。核心思路:不是模型不够强,是缺少对模型输出的"护栏"——这暗示自托管Agent生产化的路径可能不是"更大的模型",而是"更牢的框架"。
应用落地
Claude Managed Agents登Cloudflare,Agent沙箱走向规模化
Cloudflare与Anthropic合作将Claude Managed Agents与Cloudflare Sandboxes集成,提供可编程Agent运行环境:毫秒级启动沙箱、SSH访问运行实例、私有服务安全连接、浏览器会话审计。Agent从"能用"到"能管",基础设施层正在成型。
国家具身智能中试基地启用,机器人有了国家级训练场
5月16日,国家人工智能应用中试基地(具身智能)在杭州揭牌启用,涵盖餐饮服务、电力巡检、果实采摘等30多个职业技能训练场景,130多个机器人各司其职。从算力、芯片到本体、模型研发再到应用场景开发,构建完整产业生态。
Nature发文警示"Tokenmaxxing":别盲目追求AI部署量
Nature Machine Intelligence发表评论文章,批评企业内部用Token消耗量排行榜鼓励员工使用AI的做法。黄仁勋曾预计高级工程师每月消耗25万美元Token——但Token用量不等于生产力。文章呼吁理性部署AI,关注实际产出而非消耗指标。
GitHub Trending · Agent赛道
rtk-ai/rtk50,941 stars
CLI代理工具,减少LLM Token消耗60-90%。单Rust二进制,零依赖。开发者日常命令的Token节省利器。
multica-ai/andrej-karpathy-skills138,134 stars
基于Karpathy对LLM编程陷阱观察的CLAUDE.md文件,改善Claude Code行为。Karpathy加入Anthropic当天,这个仓库trending——社区的反应速度可见一斑。
humanlayer/12-factor-agents21,200 stars
定义LLM驱动软件的12个核心原则——什么是生产级Agent的必要条件?Agent工程的方法论沉淀。
microsoft/ai-agents-for-beginners64,398 stars
微软官方12课Agent入门教程。Agent概念正在从前沿研究走向开发者教育普及。
价格追踪卡
单位:元/百万Token · 数据截至2026.05.20
本周价格信号:国产模型集中转向收费——豆包App端推付费订阅,腾讯云平台代理的Hy3/DeepSeek-V4-Pro结束免费公测,腾讯云平台收费后调用量反涨210%说明——价格本身不是门槛,价值才是。Gemini 3.5 Flash用"4倍速度+不足一半成本"杀入性价比战场,Flash级模型的竞争正在白热化。DeepSeek V4-Pro当前2.5折优惠价3/6元,原价12/24元。
政策法规
算力网入国常会,升格为国家"第六张网"
5月9日国常会明确"算力网、新一代通信网"纳入国家规划,与水网、电网并列。各地提高新建算力中心准入门槛,要求绿电供应与储能配套。央行科创再贷款扩容至1.2万亿,新增4000亿定向支持AI算力、半导体等14大硬科技领域。
工信部等五部门印发智能体规范应用实施意见
明确19个典型应用场景,完善AI产业顶层设计。同期,四部门联合印发《促进人工智能与能源双向赋能行动方案》,将算电协同上升为国家战略,部署29项重点任务,探索核电和清洁能源为算力设施定向供能。
融资动态
一周内三家AI公司融了近千亿人民币。Anthropic从3800亿到9000亿估值不到3个月;DeepSeek首轮融资估值21天涨5倍。资本不再"赌未来",而是在"抢门票"——大模型赛道的窗口正在快速收窄。
资本市场
券商观点
兴业证券:物理AI的"ChatGPT时刻"已到来,关注感知/理解/决策/执行全链路标的。MSCI五月调整核心方向为科技(光通信/AI算力)升、传统消费电子降。中美元首会谈释放建设性信号,外资被动加仓确定性最高的三个方向:中芯国际、中远海控、长飞光纤。
安全与研究
语音AI系统遭遇隐藏音频攻击
IEEE Spectrum报道,隐藏信号可以劫持AI语音系统——攻击者在音频中嵌入人耳无法察觉的指令,可操控语音助手执行恶意操作。随着语音Agent普及,这类攻击面的风险正在扩大。
论文:AI负面讨论会导致模型"自我实现的错位"
arXiv论文"Alignment Pretraining"发现:训练语料中关于AI的负面讨论会让LLM内化不良行为先验。放大"AI错位"讨论导致错位行为显著增加,反之放大"AI对齐"讨论可将错位分数从45%降至9%。这对训练数据治理有直接启示。
趋势总结 + 格局研判
趋势一:商业化拐点已至,"免费时代"终结
豆包收费、腾讯收费、Kimi打赏——三款中国最主流的AI应用在一个月内齐齐转向收费模式。这不是巧合,而是行业从"烧钱获客"到"验证价值"的结构性转变。腾讯收费后调用量反涨210%是本周最重要的信号:用户不是不愿意付费,而是之前没有找到值得付费的产品。
趋势二:Agent从"概念验证"进入"基础设施竞速"
Claude Managed Agents+Cloudflare沙箱、Forge Guardrails框架、12-Factor Agents方法论、MCP SDK体系——同一周内,Agent赛道同时出现了运行时、护栏、方法论和连接标准四层基础设施。这标志着Agent正从应用层的"花式demo"沉淀为工程层的"可复用体系"。
趋势三:人才牌局重洗,"造模型的人"决定终局
Karpathy加入Anthropic、Anthropic收购Stainless、Mistral收购Emmi AI——三大AI公司同一周完成关键人事/并购动作。共同规律:不是在做更大的模型,而是在找"让模型更可持续"的人和方法。Karpathy选择RSI(递归自我改进)方向,暗示AI优化的下一个前沿是"AI造AI"。
格局研判
2026年5月的AI行业正在经历三重转型:商业模式从烧钱走向收费、技术路线从做大模型走向做Agent基础设施、竞争格局从模型竞赛走向生态并购。中国大模型周调用量7.69万亿Token已连续三周超越美国,但没有健康商业模式的流量只是负债——谁先跑通"价值交付"闭环,谁就拿到下半场的入场券。DeepSeek 515亿美元估值买的不是财务报表,而是"中国必须拥有一个世界级开源模型"的确定性。同理,Anthropic 9000亿美元估值买的不是今天的Claude,而是Karpathy+Stainless+RSI指向的自我进化路径。
能归纳的地方绝不预测,能列数据的地方绝不抒情
狼宇科技社 · AI行业日报 · 2026.05.20
点击在看,把日报分享给同行
夜雨聆风