



AI行业本周纵览
AI Industry Weekly Overview
(2026.05.23-05.29)
本周,中国人工智能产业迎来政策、技术与资本的三重共振。国家发改委启动AI立法研究并谋划“人工智能+”配套文件,国产AI芯片首次纳入国家信创安全认证体系,最高法着手制定涉AI与数据产权司法规则。
产业数据方面,中国大模型周调用量连续四周蝉联全球首位,达美国2.1倍。
模型生态层,阿里Qwen3.7-Max登顶编程榜全球第二,腾讯Hy3 preview调用量增长10倍,Anthropic发布Claude Opus 4.8并估值逼近万亿美元,开源项目Superpowers GitHub星标突破20万。智谱推出400 tokens/s高速版API。
整体来看,行业正从无序价格战转向技术效率竞争,“通用降价走量、高端溢价保值”的K型分化格局确立。

01 行业政策资讯

中国AI周调用量达美国1.81倍,
连续三周稳居全球首位
根据OpenRouter最新数据测算,5月11日至17日当周,全球AI大模型总调用量为26.9万亿Token,环比增长4.7%。其中,中国AI大模型周调用量达7.693万亿Token,同期美国为4.24万亿Token——中国达到美国的1.81倍,连续三周稳居全球第一。调用量排名全球前三的模型中,两款为中国产品,分别是腾讯Hy3 preview(2.66万亿Token,环比大增210%)和DeepSeek-V4-Flash(2.06万亿Token)。
与单纯算力竞赛不同,这一领先背后是日常办公场景的强势支撑,AI工具正逐步从“玩乐”走向“干活”
稳居全球首位!中国大模型周调用量连续三周超越美国:腾讯Hy3 preview大涨210%登顶,Kimi K2.6跌出前五
https://baijiahao.baidu.com/s?id=1865495963869876674&wfr=spider&for=pc
中国首次将国产AI芯片
纳入国家信创安全认证体系
中国信息安全测评中心与国家保密科技测评中心联合发布《安全可靠测评结果公告(2026年第2号)》,首次将人工智能训练推理芯片纳入安全可靠测评体系。华为海思、平头哥、壁仞科技等7家企业的9款国产AI芯片全部获评安全等级I级,标志着国产AI算力基础设施正式进入国家信创安全认证体系。
新浪财经:最新!国家《安全可靠测评》结果公告
https://finance.sina.com.cn/wm/2026-05-26/doc-inhzfwqa2692686.shtml
最高法:研究制定涉人工智能、
数据产权司法保护规范性文件
5月27日,最高人民法院明确将聚焦新兴产业领域,研究制定涉人工智能、数据产权司法保护的规范性文件,重点完善数据权属、数据交易、AI生成物等方面的裁判规则,助力完善数据要素基础制度体系。
中国网:中国发布丨最高法:研究制定涉人工智能、数据产权司法保护的规范性文件
http://news.china.com.cn/2026-05/28/content_118518662.html

02 行业数据洞察

中国大模型周调用量连续四周稳居全球首位
据OpenRouter最新数据测算,5月18日至5月24日当周,全球AI大模型总调用量达28.9万亿Token,较此前一周增长7.4%,连续五周上涨。其中,中国AI大模型周调用量达9.223万亿Token,环比增长19.89%;同期美国为4.93万亿Token,环比增长16.27%。中国大模型周调用量连续四周超过美国并稳居全球首位,表明中国AI大模型正在更深地进入全球开发者调用体系。

新浪新闻:中国AI大模型Token调用量持续领跑
http://k.sina.com.cn/article_5952915720_162d24908067040tng.html
API调用成本同比暴跌67%,
模型降价潮蔓延至小米与DeepSeek
过去一年企业级大模型Token调用成本同比暴跌67%,开源模型已占据企业Token调用量38%的份额。5月27日,小米宣布旗下MiMo-V2.5系列API实施永久降价,最高降幅达99%。此前,DeepSeek于5月22日宣布其旗舰模型V4-Pro的API价格永久降价75%。当前国内大模型市场呈现明显的“K型分化”特征——阿里云通义千问、字节跳动豆包等通用型大模型相继下调API调用价格,而智谱GLM、腾讯混元等主打企业定制服务的模型则维持价格稳定甚至小幅上调,形成“通用模型降价走量、高端模型溢价保值”的新格局。这一趋势反映出行业正从无序价格战转向算法优化、推理升级驱动的技术效率竞争。
新浪新闻:小米紧跟DeepSeek宣布大模型API永久降价,最高降幅99%
https://baijiahao.baidu.com/s?id=1866303943143158420&wfr=spider&for=pc
中国AI融资马太效应持续强化,
头部企业估值高企
2026年一季度中国AI领域融资事件近600起,总额超1100亿元,同比激增185.4%,相当于2025年同期的近3倍。仅5月单月,月之暗面与阶跃星辰两家就拿走了超300亿元资金。5月份,Kimi完成约20亿美元新一轮融资,投后估值突破200亿美元,至此Kimi在不到半年内累计融资超39亿美元(约376亿元),估值翻了近5倍,成为国内大模型创业公司中融资额最高的玩家。资本市场的布局逻辑也在从单一核心赛道向全产业链上下游延伸,AI算力、数据要素、垂直行业应用等配套赛道同步迎来资本红利,如基础设施企业无问芯穹成功获得超7亿元融资。与此同时,具身智能赛道投融资动作频繁,5月份以来飞捷科思、眸深智能等企业亿元级融资接连落地,赛道投资活跃度持续走高。
新浪财经:1100亿AI融资狂潮:算力吞掉半壁江山,商业化兑现前的生死竞速
https://baijiahao.baidu.com/s?id=1866245435330772307&wfr=spider&for=pc

03 标杆企业动态

阿里:Qwen3.7-Max登编程榜全球第二
5月,阿里通义千问最新旗舰模型Qwen3.7-Max在编程竞技榜拿下全球第二名,以1541分的成绩超越GPT-5.5、Gemini 3.5 Flash和DeepSeek V4 Pro,仅次于Claude Opus 4.7。该模型在SWE-Bench等专业编程评测中均拿下国产模型冠军,能够在全新的芯片平台上自主完成35小时的复杂任务,期间调用超过1000次工具。阿里云CTO李飞飞在千问大会上提出“模型-智能体云-工具服务-规模”四层架构,强调AI落地从模型能力到可执行工具的完整闭环。

腾讯:Hy3 preview上线两周调用量增长10倍
腾讯Hy3 preview上线两周内Token调用量实现10倍增长,并登顶全球调用量榜首。腾讯云宣布面向全球市场推出新产品,包括企业AI助手腾讯WorkBuddy、设计工具腾讯设计Miora以及代币管理平台TokenHub。同时,腾讯将继续采购英伟达H200AI芯片,并深化与本土芯片制造商的合作,采取“国际+本土”双轨战略。

OpenAI:GPT-5.6提前泄露,
上下文窗口扩展至150万Token
OpenAI的GPT-5.6被开发者在后端日志中提前扒出,内部代号iris-alpha,上下文窗口直接飙升至150万Token,较GPT-5.5的105万Token增加了43%。GPT-5.5已于5月5日全量推送为ChatGPT默认模型,幻觉率最高减少52.5%,在医疗、法律、金融等高风险提示中,不准确声明降低37.3%。OpenAI同时发布了GPT-4.1系列(编码与指令跟随优化)以及o3和o4-mini推理模型。

Anthropic:发布Claude Opus 4.8
Anthropic正式发布Claude Opus 4.8,不仅较前代版本进一步强化编程、智能体(Agent)和复杂任务处理能力,还新增用户可控“思考投入”机制,以及面向大型任务的新功能“动态工作流”(Dynamic Workflows),使模型能着手解决超大规模的复杂问题。相比前代Claude Opus 4.7,Opus 4.8新增了“快速模式”(Fast Mode),在该模式下,模型的运行速度可提升至常规的2.5倍,现在的成本仅为此前模型的三分之一。

Superpowers(开源项目关注度持续飙升)
开源项目Superpowers在GitHub上已获得约199,943个星标,日增约1,700星,是5月GitHub Trending上最受关注的AI项目之一。
Superpowers不是传统的工具或框架,而是一套为AI编程助手设计的软件开发方法论。它通过一组可组合的“技能”(Skills)——即Markdown格式的指令文件——为Claude Code、Cursor、Codex等AI编码工具装上一套结构化工流程:先设计再写代码 → TDD红绿重构 → 子代理并行执行 → 两阶段代码审查。该方法的核心理念是解决AI编程助手“有天赋但没纪律”的问题:它们像聪明但从来不写测试的同事,代码出活快但问题也出得快。Superpowers将这些“技能”标准化,让AI在开始任何任务前先检查有没有匹配的技能可用,从而将工程纪律编码进AI的工作流程中。
目前Superpowers已发布v5.1.0稳定版本,支持以插件形式安装到Claude Code、Cursor、OpenCode、Codex、GitHub Copilot CLI甚至Gemini CLI上。

智谱 GLM-5.1 高速版(发布)
5月22日,智谱面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达到400 tokens/s,刷新了当时全球大模型厂商API的速度上限。更重要的是,GLM-5.1高速版首次在国产大模型中实现了旗舰级能力与低延迟的双重突破,打破了“高速模型几乎总是轻量级模型”的行业惯例。
该高速版API由智谱GLM团队与TileRT团队联合打造,在推理引擎、调度系统与底层基础设施三个层面进行了系统级优化,将单卡吞吐能力、高并发场景尾延迟以及集群部署效率全面提升,适用于AI编程、实时交互、商业决策、实时语音等高响应需求场景。
音频与数字人视频生成模型密集开源
5月22日,美团龙猫大模型团队宣布正式开源商用级数字人视频生成模型LongCat-Video-Avatar1.5,在唇形同步、物理合理性、长视频稳定性、多人互动及高效推理等核心维度上完成全面跃升,在EvalTalker评测中用户偏好胜率全面超越Kling Avatar2.0、OmniHuman-1.5和HeyGen。模型采用DMD(分布匹配蒸馏)技术实现约15倍的推理效率提升,生成一段10秒的视频仅需约1分钟。

LTX-2音视频生成模型同步亮相,基于190亿参数的扩散变换器架构,支持4K分辨率下叙事视频的同步音频生成,能够通过文本、深度图、姿态关键点等多种输入方式控制生成内容,并在消费级GPU上高效运行。
大模型API密集降价,商业化提速
DeepSeek宣布V4-Pro价格永久降价75%,小米宣布MiMo-V2.5系列API最高降幅达99%。叠加此前阿里云通义千问、字节跳动豆包等通用型大模型的下调动作,国内大模型市场已形成通用模型以价换量、高端模型以差异化保溢价的竞争格局。


04 AI生态工具更新

大模型API密集降价,商业化提速
Claude Opus 4.8(Anthropic):5月28日发布,旗舰模型换代仅隔41天。新增“不确定时主动告知”能力,快速模式成本降至原来的1/3(输入每百万token 5美元),Claude Code中新增“动态工作流”支持数百个子智能体并行处理大规模任务。同日宣布650亿美元H轮融资,估值达9650亿美元。

GLM-5.1 高速版(智谱):5月22日面向企业客户发布,输出速度达400 tokens/s,刷新全球大模型API速度上限。首次在国产大模型中实现旗舰级能力与低延迟双重突破,由GLM团队与TileRT团队联合打造。

DeepSeek-V4 Pro 价格调整:5月24日宣布API价格永久下调75%,使其在“性价比”全球排名中位列前茅。该模型于2026年4月开源,含V4-Pro(1.6万亿总参数、49B激活)与V4-Flash两个版本。
Kimi K2.6 社区和解(月之暗面):5月26日,Kimi Code团队与开源社区达成和解,此前因账号风控策略引发的争议平息。K2.6是月之暗面能力最强的代码模型,720亿参数MoE架构(推理激活180亿),支持200K上下文。
AI编程与开源工具
Superpowers(开源项目):本周GitHub星标突破20万(截至5月29日约20.3万),继续领跑AI工具类周增长榜。该项目为Claude Code、Cursor等AI编码工具添加结构化软件开发方法论(TDD、代码审查、子代理并行等),v5.1.0稳定版已支持以插件形式安装到主流AI编码工具。
Cursor Agent 2.0(Cursor):支持8个并行Agent协作开发。虽发布时间略早于本周,但其影响在本周持续扩散,多家开发社区讨论其“多Agent协同”的实际效果。
END
夜雨聆风