
核心摘要:
1、Anthropic 完成 300 亿美元融资,估值超 9000 亿美元登顶全球;
2、面壁智能联合清华开源国产算力端侧大模型 BitCPM-CANN;
3、DeepSeek-V4-Flash 登顶全球调用榜且 V4-Pro 永久降价 75%;
4、英伟达 Vera 智能体 CPU 首批交付头部企业;
5、Claude 测试双模记忆与 Conway Agent 平台;
6、OpenAI Codex 重大更新并加速商业化;
7、国内 AI 监管落地,综合性立法提上日程。
一、模型发布与开源
1、面壁智能联合清华开源 BitCPM-CANN,国产算力端侧部署突破
面壁智能联合清华大学、OpenBMB 开源社区正式发布BitCPM-CANN,这是中国首个完全基于华为昇腾实现端到端训练并开源的 1.58-bit(三值)端侧大模型。最小版本仅需200MB 内存即可运行于智能手表,模型能力保留率达 97%,600 亿参数版本未来可适配 8GB 手机,大幅降低国产算力环境下端侧 AI 落地门槛。

2、马斯克宣布 Grok V9-Medium 完成训练,2-3 周内发布
马斯克在 X 平台官宣,**Grok 基础模型 V9-Medium(1.5T)** 已完成训练,当前进入微调阶段,强化学习模块将于数日后启动,预计 2-3 周内正式上线。相较当前主力 V8-Small(0.5T),V9-Medium 在复杂编码、长文本推理与多模态理解能力上实现跨越式升级,同时优化了实时交互响应速度。


3、智谱 AI 发布 GLM-5.1 高速版,400 tokens/s 刷新全球速度纪录
智谱 AI 正式推出GLM-5.1 高速版,以 400 tokens/s 的生成速度刷新全球大模型推理速度纪录,标志着大模型竞争从参数规模、价格战向速度维度全面转移。该模型在 Agent 任务、代码生成与长文本摘要场景下效率提升显著,已通过智谱开放平台向开发者提供 API 服务。

4、字节跳动联合港科大发布 MMProLong,长文档多模态理解突破
字节跳动与香港科技大学联合发布MMProLong,针对多模态大语言模型(LMM)长文档训练痛点,创新训练架构使问答对生成效率远超传统 OCR 转录方案。模型支持 100 万 token 超长文档的图文联合理解,在学术文献、商业合同、技术手册等场景下准确率提升 25%,相关技术已在字节内部产品落地。

二、开发生态与工具更新
1、OpenAI Codex 重大更新,新增 Appshots、/goal 自主编码等功能
OpenAI 宣布 Codex 编程模型迎来重磅迭代,核心更新包括:Appshots(网页 / 应用界面截图直接生成代码)、/goal(自然语言设定目标,自主拆解并完成编码任务)、Mac 锁屏远程使用、网页标注、插件共享与团队协作功能升级。同时加速商业化进程,Codex 周活用户突破 400 万,企业版订阅价格下调 30%,助力开发者提升编程效率。
2、DeepSeek Reasonix 开源,面向 DeepSeek API 的优化编码 Agent
DeepSeek 在 GitHub 开源Reasonix,这是一款专为 DeepSeek API 打造的原生编码 Agent,采用激进前缀缓存优化技术,推理成本降低 40%,代码生成速度提升 3 倍。支持多文件项目管理、代码调试、自动化测试与部署,已适配 DeepSeek-V4-Flash/Pro 全系列模型,开发者可免费商用。

3、阿里 Qoder 推出 QoderWake,本地搭建 7×24 小时 AI 数字员工团队
阿里旗下 Qoder 发布QoderWake,支持开发者在本地电脑组建全天候 AI 数字员工团队,首发开放编程、设计、运营、数据、法务、翻译 6 个内置岗位,优先适配 Mac 系统。每个数字员工具备独立思考与协作能力,可自动分配任务、同步进度并生成报告,大幅降低中小企业 AI 团队搭建成本。
4、腾讯 ima 开放 Copilot,全平台 AI 助手生态升级
腾讯宣布ima Copilot正式对外开放,接入混元大模型全能力,支持文本、图像、音频多模态交互。覆盖办公、创作、学习、生活四大场景,提供文档生成、PPT 制作、代码辅助、智能问答等功能,同时开放第三方开发者接入接口,共建 AI 助手生态。

三、产品应用落地
1、DeepSeek-V4-Flash 登顶全球 AI 大模型调用榜,V4-Pro 永久降价 75%
多家权威榜单数据显示,DeepSeek-V4-Flash周调用量连续五周上涨,登顶全球 AI 大模型调用榜,成为当前最受开发者青睐的模型。同步宣布V4-Pro API 永久降价 75%,原 5 月 31 日截止的 2.5 折优惠结束后,价格将固定为原价的 1/4:缓存未命中输入 3 元 / 千 token、输出 6 元 / 千 token,持续领跑全球大模型性价比。
2、腾讯新闻上线 AI 电台,基于混元大模型实现对话式新闻体验
腾讯新闻推出AI 电台,依托腾讯混元大模型打造,颠覆传统电台单向播报模式,支持用户实时插话提问、话题延伸与深度解读。产品围绕 “广场”“电台”“订阅” 三大模块,提供个性化新闻推送、定制化音频生成与互动社区功能,已在 iOS/Android 全平台上线。
3、可灵 AI 短漫剧工业化落地,成本暴跌 10 倍、产能暴增 8 倍
可灵 AI 发布短漫剧工业化解决方案,通过 AI 剧本生成、智能分镜、自动绘图与配音技术,将单集短漫剧制作成本降低 10 倍,产能提升 8 倍。当前 AI 微短剧市场占比已超 95%,内容产业正式从手工作坊迈入工业化生产阶段,可灵 AI 已与多家短视频平台达成合作。
4、全国人形机器人 “身份证” 平台接入企业增至 500 家
全国首个人形机器人统一身份认证平台持续扩容,截至 5 月 25 日,接入企业达 500 家,完成赋码机器人超 3.5 万台。平台实现机器人全生命周期溯源、运行数据监控与安全风险预警,同时对接监管部门,推动人形机器人产业规范化、标准化发展,加速商业化落地进程。
四、技术洞察与前沿研究
1、HBM 成本占比达 63%,成为 AI 芯片核心成本瓶颈
Epoch AI 最新数据显示,2024 年 Q1 至 2025 年 Q4 期间,高带宽内存(HBM)在 AI 芯片组件成本中占比从 52% 攀升至63%,绝对投入从 120 亿美元增至 320 亿美元。微软、Meta 等企业已在 2026 年资本支出中额外预留 350 亿美元应对内存涨价,行业预计 DRAM 供应缓解后,硬件成本有望降低 3 倍。
2、北大团队突破 1 纳米栅极铁电晶体管,超低功耗 AI 芯片迎来突破
北京大学团队在《科学进展》发表突破性成果,成功研制1 纳米栅极铁电晶体管,具备超低功耗、高开关比与长寿命特性。该技术为下一代超低功耗 AI 芯片提供核心器件支撑,可大幅降低端侧与边缘设备 AI 运行能耗,推动可穿戴设备、物联网终端的 AI 普及。
3、Claude 测试双模记忆 + Conway Agent 平台,企业错误率降至 3%
Anthropic 正在为 Claude 测试双模记忆系统(短期上下文 + 长期向量数据库)与Conway Agent 平台,支持 7×24 小时不间断运行、跨会话记忆与自主任务执行。内部测试数据显示,企业级 Agent 任务完整解决率达 3.8%,错误率降低 97%,大幅提升企业 AI 应用可靠性。
4、端云协同成企业 AI 部署主流,英特尔方案云端 Token 降 70%
行业趋势显示,企业 AI 部署正从 “纯云端依赖” 向 “端云协同” 全面转型。英特尔 SuperClaw 方案通过本地优先架构,将敏感数据与简单任务留在端侧 NPU 处理,复杂任务卸载至云端,使云端 Token 消耗降低 70%,敏感信息识别准确率达 99%,已获超百家企业采用。
五、行业动态与企业动作
1、Anthropic 完成 300 亿美元融资,估值超 9000 亿美元登顶全球
Anthropic 宣布完成300 亿美元新一轮融资,由红杉资本、Dragoneer、Greenoaks、Altimeter 联合领投,投后估值突破9000 亿美元,超越 OpenAI(8520 亿美元)成为全球估值最高 AI 初创公司。公司预计 2026 年 Q2 营收达 109 亿美元(同比 + 130%),并实现首次季度运营盈利,商业化进程全面加速。
2、英伟达 Vera 智能体 CPU 首批交付,单核性能提升 50%
英伟达宣布首款面向智能体(代理式 AI)的专用 CPU Vera正式投产,首批设备已交付 Anthropic、OpenAI、SpaceXAI 及甲骨文云等头部企业。Vera 搭载 88 颗自研 Olympus 核心,内存带宽 1.2TB/s,单核性能提升 50%,适配智能体编排、强化学习、长上下文管理等场景,数据供给能效较传统设施提升 2 倍。
3、国务院明确 AI 综合性立法,监管进入强执行期
国务院办公厅发布《国务院 2026 年度立法工作计划》,明确提出加快推进人工智能健康发展综合性立法,标志着 AI 治理从分散规制转向统一立法。叠加国家网信办等三部门发布的《智能体规范应用与创新发展实施意见》、新修订《网络安全法》,AI 监管全面进入 “强执行期”,为产业健康发展划定边界。
4、Kimi 完成 20 亿美元融资,估值突破 200 亿美元
据行业消息,Moonshot AI 旗下Kimi完成 20 亿美元新一轮融资,投后估值突破 200 亿美元,成为国内估值最高 AI 初创公司之一。融资资金将用于大模型技术研发、多模态能力升级与商业化落地,重点布局企业服务、内容创作与智能助手三大场景。
六、前瞻与市场传闻
1、OpenAI 最快 9 月 IPO,目标估值 1 万亿美元
知情人士透露,OpenAI 加速推进 IPO 进程,最快 2026 年 9 月在纳斯达克上市,目标估值约 1 万亿美元。公司当前年化营收约 300 亿美元,周活用户 9 亿,付费订阅用户超 5000 万,但 2026 年预计仍亏损 140 亿美元,上市后将重点投入技术研发与算力建设。
2、苹果 iOS 27 深度集成 AI,新增壁纸生成与智能快捷指令
行业爆料,苹果 WWDC 2026(6 月 8 日)发布的iOS 27将深度融合 AI 技术,新增 AI 壁纸生成、智能快捷指令、实时翻译、文档摘要等功能。依托端侧神经网络引擎,实现本地 AI 处理,保护用户隐私,同时提升系统交互智能化与个性化体验。
3、字节 Seedance 2.1 即将发布,数字人生成效果提升 20%
据内部消息,字节跳动Seedance 2.1数字人模型将于 6 月初发布,重点优化面部细节、肢体协调性与表情自然度,生成效果提升 20%。同时支持实时驱动、多风格切换与口型精准同步,将用于直播、短视频、虚拟偶像等场景,助力内容创作工业化。
七、Claw 专题动态
1、Claude Conway Agent 平台开放 Beta,双模记忆赋能长任务执行
Anthropic 正式开放Conway Agent 平台Beta 测试,集成双模记忆系统,支持 Claude 智能体跨会话长期记忆、任务断点续传与自主规划执行。平台提供可视化 Agent 编排界面、工具库(代码执行、网页浏览、文件管理)与企业级安全管控,已向企业用户开放申请,助力快速构建定制化 AI 智能体。
2、英伟达 Vera CPU 重构 Claw 算力底座,加速智能体规模化部署
英伟达 Vera CPU 作为首款智能体专用处理器,为 Claw 生态提供高效算力支撑,单核性能提升 50%,长上下文处理能力优化 3 倍。可与 Rubin GPU、BlueField4 DPU 协同,构建端到端智能体算力集群,降低 Claw 应用部署成本,提升运行稳定性,推动 Agent 技术从实验室走向大规模商业化。
3、GitHub Claw 工具日增星标超 5000,知识图谱与记忆管理成热点
本周 GitHub Trending 榜单 Claw 生态工具持续霸榜,Understand-Anything(代码知识图谱)、agentmemory(持久记忆管理)、codegraph(预索引代码图谱)日增星标均超 5000 颗。其中 agentmemory 已被 10 + 主流 Claw 框架集成,成为智能体跨会话记忆的标准解决方案,大幅提升长任务执行连贯性。
八、GitHub 热门开源项目
2026.05.25 全球 Trending AI 类
1、OpenBMB/BitCPM
星标数:12,800(今日 + 5,300) 项目简介:中国首个基于华为昇腾端到端训练的三值端侧大模型,200MB 内存可运行智能手表,能力保留率 97%,开源助力国产算力端侧 AI 生态建设。
2、deepseek-ai/reasonix
星标数:8,500(今日 + 4,200) 项目简介:面向 DeepSeek API 的原生编码 Agent,前缀缓存优化降本 40%,支持多文件管理、调试与部署,适配 DeepSeek 全系列模型,免费商用。
3、microsoft/Understand-Anything
星标数:25,600(今日 + 5,800) 项目简介:代码知识图谱工具,将代码转为可交互图谱,支持 Claude Code、Codex、Cursor 等全平台 AI 编程工具,智能问答与教学,本地运行保护隐私。
4、rohitg00/agentmemory
星标数:18,300(今日 + 5,100) 项目简介:AI 智能体持久记忆方案,基于真实世界基准优化,支持跨会话上下文记忆、长任务断点续传,已集成主流 Claw 框架,提升智能体稳定性。
5、andrej-karpathy/andrej-karpathy-skills
星标数:152,000(今日 + 4,500) 项目简介:Andrej Karpathy 总结的 LLM 编码最佳实践(CLAUDE.md),被全球开发者广泛采用为 Claw 开发标准,单文件记录核心行为准则,提升 AI 编程效率。

深圳市雪球易创科技有限公司(SnowEngine),是国内领先的多云管理服务商(MSP)与企业级 AI 解决方案提供商,深耕云计算与人工智能领域,致力于成为企业数字化转型最可信赖的长期伙伴。
我们可提供全维度企业数字化服务:
✅ 全栈云服务:多云统一纳管、无忧云迁移、架构升级与成本优化,适配微软、阿里、腾讯、谷歌等主流云平台;
✅ 企业级 AI 落地:一站式接入全球 300 + 顶尖 AI 模型,定制化 AI 解决方案、私有化部署与全生命周期运维;
✅ 安全合规保障:遵循等保 2.0、GDPR 等国际标准,全链路数据安全防护,适配金融、医药、政务等强监管行业;
✅ 全周期运维支持:7×24 小时技术响应,专属团队全程陪跑,保障企业业务稳定运行。


全球 300 + 顶尖 AI 模型一键接入!

📩 商务合作 & 资讯&订阅:后台回复「相关内容如:AI大模型/云服务」立即咨询
目前我们已服务全球 1000 + 企业客户,业务覆盖深圳、上海、北京、香港、新加坡、美国等全球核心区域,可为不同行业、不同规模的企业量身定制数字化与智能化转型方案。


夜雨聆风