AI 周报|2026.05.05-05.10

AI 产品与应用落地

‎OpenAI升级默认模型：幻觉减少52.5% OpenAI将ChatGPT默认模型升级为GPT-5.5 Instant，医疗/法律/金融领域幻觉声明减少52.5%，回复更简洁。已全量推送，付费用户可保留旧版本3个月过渡。
‎豆包披露付费方案：三档68-500元/月 字节豆包推出付费订阅，标准版68元/月、加强版200元/月、专业版500元/月，聚焦PPT生成/数据分析等生产力场景。免费版继续保留，差异化满足专业用户需求。
‎Claude深度集成Office：跨应用文档同步 Anthropic发布Claude for Microsoft 365，可在Excel/Word/PowerPoint间同步上下文，自动分类邮件并生成草稿。付费用户可用，提升办公协作效率。
‎百度文心5.1发布：预训练成本仅业界6% 百度发布文心大模型5.1，采用多维弹性预训练技术，以业界6%的预训练成本实现基础效果领先，搜索能力登LMArena国内第一。已上线千帆平台面向企业开放。
‎阶跃星辰推实时语音：支持情绪感知+人设自定义阶跃星辰发布StepAudio 2.5 Realtime，可感知语调/语速/停顿等副语言信息，支持开发者通过API自定义角色性格。真人对话评分80.41，高于竞品。
StepAudio 2.5 Realtime 上线！真人级实时语音对话能力，千万人设任你打造
‎中国移动上线8万+数智员工：推移动版智能助理报道中国移动披露已上线超8万名数智员工，将推移动版智能助理升级App/云电脑等入口。聚焦网络鉴伪/研发设计/营销服务等场景落地。

开发与技术进展

‎腾讯开源多模态搜索方案：7项基准平均提升10%+ 腾讯混元联合高校发布OpenSearch-VL，通过强化学习训练多模态深度搜索智能体，构建3.6万条指令微调数据。在7项基准测试中平均性能提升超10个百分点。
开源地址：https://github.com/shawn0728/OpenSearch-VL
‎谷歌推MTP起草器：Gemma 4推理提速3倍谷歌为Gemma 4发布多Token预测起草器，利用推测解码架构，在不降质量前提下将推理速度最高提升3倍。本地设备测试达2.2倍加速，降低边缘部署门槛。
‎小米开源语音克隆模型：单模型覆盖 600+语种小米AI实验室发布OmniVoice，仅用双向Transformer实现文本到语音直出，19语种测试相似度/可懂度超越商用系统。支持自定义音色与带噪音频适配。
超600种语言，一个模型全搞定! 小米开源 OmniVoice 多语言语音克隆 TTS
‎OpenAI发布实时语音模型：具备GPT-5级推理能力 OpenAI推出GPT-Realtime-2/Translate/Whisper三款模型，其中Realtime-2具备GPT-5级推理能力，支持对话中调用工具与处理打断。输入定价32美元/百万Token。
‎商汤推轻量化多模态模型：Token消耗降60%报道商汤发布SenseNova 6.7 Flash-Lite，取消视觉转文本中间层，信息搜索场景Token消耗直降60%，实现毫秒级反馈。已开源SenseNova-Skills办公技能套件。
商汤发布日日新SenseNova 6.7 Flash-Lite，Token消耗直降 60%，Token Plan同步开放
‎蚂蚁百灵发万亿级模型：支持推理强度自定义报道蚂蚁百灵发布Ring-2.6-1T，引入Reasoning Effort机制支持high/xhigh两种推理强度。PinchBench得分87.60超越竞品，已开放限时免费体验。
蚂蚁万亿参数思考模型来了！实测AIME真题难不倒，会写爽文、规划出行

硬件与基础设施

‎AMD预览MI430X显卡：FP64性能超英伟达6倍报道AMD预览Instinct MI430X加速器，原生FP64算力超200 TFLOPs，预计达英伟达Rubin架构6倍以上。兼顾AI与传统HPC负载，服务气候学/材料科学等高精度场景。
‎新华三发万亿级超节点：支持16384卡扩展报道新华三发布UniPoD S80000，覆盖32-1024卡全系列，最高可扩展至16384卡。搭配AI智算工具链，交付一站式智算解决方案。
‎紫光展锐发端边AI芯片：4nm工艺+降低 39% 成本紫光展锐发布N9系列，采用4nm工艺与Arm v9.2架构，帮助客户降低39% BOM成本、缩短67%开发周期。集成UniLLM GenAI与智能体框架。
‎新紫光推近存计算架构：存储带宽达30TB/s 新紫光发布"紫弦"三维化近存计算架构，以3D DRAM为核心首创3.5D异质集成方案，存储带宽达30TB/s。模拟显示Token吞吐率较英伟达B200高1.5-2倍。
‎群晖推AI监控摄像头：支持本地人流/车辆计数群晖发布BC510/TC510，支持2880×1620@30FPS录制，内置边缘AI可本地运行人流与车辆计数、入侵侦测。具备IP66/67防护与30m夜视。
‎中国移动发模型服务平台：接入300+模型成本降30% 中国移动发布MoMA平台，接入超300款主流AI模型，首创Token集约化运营模式。基于国产算力部署，单位Token成本压降约30%，支持秒级故障切换。

资本与行业趋势

‎Anthropic拟融资数百亿：估值冲击1万亿美元 Anthropic考虑今夏筹集数百亿美元扩展算力，融资前估值达9000亿美元，有望超越OpenAI。年化收入预计超450亿美元，投资者希望在年底前建立持仓。
‎阶跃星辰完成25亿美元融资：加速赴港IPO 阶跃星辰接近完成25亿美元融资，华勤/龙旗/豪威/中兴等产业链资本参投，香港投资管理有限公司加入。已完成红筹架构拆除，进入港股上市筹备期。
‎月之暗面获20亿美元融资：估值突破200亿美元 Kimi完成约20亿美元新融资，美团龙珠领投，投后估值突破200亿美元。不到半年累计融资超39亿美元，年度经常性收入4月已超2亿美元。
‎OpenAI算力预算飙至500亿：2030年或达6000亿美元 OpenAI总裁披露今年算力开支预计达500亿美元，较2017年3000万美元增长数千倍。长期目标2030年累计计算投入约6000亿美元，支撑下一代模型研发。
‎Anthropic签谷歌2000亿协议：占云收入40%+ Anthropic承诺五年内向谷歌云支出2000亿美元，占谷歌披露未实现收入的40%以上。此前已与亚马逊签超1000亿美元算力采购协议，锁定头部云厂商资源。
‎软银缩减OpenAI质押贷款：目标降至60亿美元 软银调整以OpenAI持股作抵押的贷款计划，目标规模从100亿美元下调至60亿美元。部分债权人对未上市股权定价缺乏信心，反映资本市场对高估值资产趋于审慎。

政策与社会影响

‎三部门印发智能体实施意见：明确19个应用场景网信办/发改委/工信部联合发布《智能体规范应用与创新发展实施意见》，提出夯实基础/守牢安全/强化应用/建设生态四方面举措，明确19个典型应用场景。
‎工信部启动伦理审查先导计划：探索落地路径工信部印发通知启动人工智能科技伦理审查与服务先导计划，依托产业创新应用先导区率先探索审查落地路径。部署细化制度/建设委员会/开展实践/构建治理网络四项任务。
‎欧盟达成AI法案临时协议：高风险合规延至2027年 欧盟成员国与议会就"弱化版"人工智能法案达成临时协议，高风险系统合规时间推迟至2027年12月。禁止利用AI制作未经授权色情深度伪造内容，强制水印规定12月实施。
‎全国首例AI短剧侵权案宣判：盗录 1700+ 部获刑广州黄埔区法院一审宣判全国首例AI短剧侵权刑事案件，被告盗录超1700部短剧牟利，判处有期徒刑8个月缓刑1年2个月并处罚金。法院认定AI短剧符合著作权法作品标准。
‎上海启动AI安全监管试点：发布"红队"智能体上海市互联网协会成立人工智能工作委员会，启动"人工智能赋能安全监管"试点。谋乐网络展示AI红队智能体"Elliot"，可嵌入监管链条提供技术支持。
‎IMF警示AI放大金融风险：呼吁加强国际协调 IMF发布报告称，先进AI模型能以更低成本快速识别利用系统漏洞，网络攻击风险正变得更具系统性。呼吁各国将网络安全视为金融稳定核心议题，加强国际协调。