AI 每日快讯 | 2026年6月9日

每天 3 分钟，速览全球 AI & 科技要闻。

────────────────────────────────────────

今日头条

中国 AI 大模型调用量连续六周超越美国，DeepSeek 稳坐全球第一

OpenRouter 6 月 8 日公布的最新数据显示，6 月 1 日至 7 日全球 AI 大模型总调用量达36.1 万亿 Token，连续七周上涨。其中，中国大模型周调用量达 14.19 万亿 Token，环比大幅增长 27.49%；同期美国大模型调用量为 3.2 万亿 Token，环比下降 24.53%。中国已连续六周稳居全球调用量首位。在单品排行榜上，DeepSeek-V4-Flash 以 3.69 万亿 Token 的周调用量连续三周蝉联榜首，前四名全部为国产模型。这一数据标志着中国在AI 应用端的规模化优势正在转化为结构性领先。

────────────────────────────────────────

行业速递

▸ Anthropic新模型 Mythos 引发社区争议：社区热议 Anthropic 下一代旗舰模型 Mythos（传为 Opus 的继任者），Claude 在化学等专业科学领域的能力展示引发关注，但模型可靠性仍存争议。普林斯顿研究指出，新模型在可靠性上相比前代并无显著提升。

▸ Agent评估标准转向长期任务：最新行业报告显示，当前最难的 Agent 长期任务测试通过率仅为 2.6%，自主执行仍是巨大瓶颈。Meta 推出 OpenEnv 评估框架、Anthropic 提升 Claude Cowork 使用限制，行业正从短期基准测试转向长期可靠性评估。

▸ 开源模型密集发布：Google 发布 Gemma 4 QAT 量化检查点降低本地部署门槛，Ideogram 4.0 以开源权重杀入文生图赛道，NVIDIA 推出 Nemotron 3 Ultra 加码后训练优化。开源生态从追赶走向差异竞争。

▸ 日本 Sakana AI 设立「AI 构建AI」实验室：Sakana AI 在东京设立 RSI（递归自我改进）实验室，核心方向是将「AI 构建 AI」从理论推向实践，探索AI 自主改进系统的可能性。

────────────────────────────────────────

深度观察

调用量「东升西降」的背后：中国 AI 应用已过了从零到一的坎

14.19万亿对 3.2 万亿——这个差出接近 4.5 倍的数字，放在一年前可能没人敢信。

但真实情况是，中国 AI 大模型的调用量「超车」并非偶然。DeepSeek、通义千问、豆包、文心一言等国产模型在中文场景的精度和性价比上已经构成了「本地护城河」。与此同时，字节跳动、阿里巴巴、腾讯等厂商将模型能力深度嵌入电商、办公、社交等高频场景，天然形成了庞大的调用基数。

反观美国市场，OpenAI 和 Anthropic 虽然技术领先，但商业模式仍高度依赖 API 订阅，用户触达广度不及中国厂商将 AI「内嵌式」分发的能力。

当然，值得警惕的是：调用量高不代表技术强。从单 Token 质量来看，国产模型在复杂推理、代码生成等领域与 GPT-5.5、Claude Opus 4.8 的代差仍然存在。但数据不会说谎——「用得多」本身就是一种领先信号。

────────────────────────────────────────

今日金句

"当「用得多」开始接近「跑得快」，AI 终局的悬念就出来了。"

────────────────────────────────────────