
每天 3 分钟,速览全球 AI & 科技要闻。
────────────────────────────────────────
────────────────────────────────────────
今日头条
中国 AI 大模型调用量连续六周超越美国,DeepSeek 稳坐全球第一
OpenRouter 6 月 8 日公布的最新数据显示,6 月 1 日至 7 日全球 AI 大模型总调用量达36.1 万亿 Token,连续七周上涨。其中,中国大模型周调用量达 14.19 万亿 Token,环比大幅增长 27.49%;同期美国大模型调用量为 3.2 万亿 Token,环比下降 24.53%。中国已连续六周稳居全球调用量首位。在单品排行榜上,DeepSeek-V4-Flash 以 3.69 万亿 Token 的周调用量连续三周蝉联榜首,前四名全部为国产模型。这一数据标志着中国在AI 应用端的规模化优势正在转化为结构性领先。
────────────────────────────────────────
────────────────────────────────────────
行业速递
▸ Anthropic新模型 Mythos 引发社区争议:社区热议 Anthropic 下一代旗舰模型 Mythos(传为 Opus 的继任者),Claude 在化学等专业科学领域的能力展示引发关注,但模型可靠性仍存争议。普林斯顿研究指出,新模型在可靠性上相比前代并无显著提升。
▸ Agent评估标准转向长期任务:最新行业报告显示,当前最难的 Agent 长期任务测试通过率仅为 2.6%,自主执行仍是巨大瓶颈。Meta 推出 OpenEnv 评估框架、Anthropic 提升 Claude Cowork 使用限制,行业正从短期基准测试转向长期可靠性评估。
▸ 开源模型密集发布:Google 发布 Gemma 4 QAT 量化检查点降低本地部署门槛,Ideogram 4.0 以开源权重杀入文生图赛道,NVIDIA 推出 Nemotron 3 Ultra 加码后训练优化。开源生态从追赶走向差异竞争。
▸ 日本 Sakana AI 设立「AI 构建AI」实验室:Sakana AI 在东京设立 RSI(递归自我改进)实验室,核心方向是将「AI 构建 AI」从理论推向实践,探索AI 自主改进系统的可能性。
────────────────────────────────────────
────────────────────────────────────────
深度观察
调用量「东升西降」的背后:中国 AI 应用已过了从零到一的坎
14.19万亿对 3.2 万亿——这个差出接近 4.5 倍的数字,放在一年前可能没人敢信。
但真实情况是,中国 AI 大模型的调用量「超车」并非偶然。DeepSeek、通义千问、豆包、文心一言等国产模型在中文场景的精度和性价比上已经构成了「本地护城河」。与此同时,字节跳动、阿里巴巴、腾讯等厂商将模型能力深度嵌入电商、办公、社交等高频场景,天然形成了庞大的调用基数。
反观美国市场,OpenAI 和 Anthropic 虽然技术领先,但商业模式仍高度依赖 API 订阅,用户触达广度不及中国厂商将 AI「内嵌式」分发的能力。
当然,值得警惕的是:调用量高不代表技术强。从单 Token 质量来看,国产模型在复杂推理、代码生成等领域与 GPT-5.5、Claude Opus 4.8 的代差仍然存在。但数据不会说谎——「用得多」本身就是一种领先信号。
────────────────────────────────────────
────────────────────────────────────────
今日金句
"当「用得多」开始接近「跑得快」,AI 终局的悬念就出来了。"
────────────────────────────────────────
夜雨聆风