OpenAI升级默认模型:幻觉减少52.5% OpenAI将ChatGPT默认模型升级为GPT-5.5 Instant,医疗/法律/金融领域幻觉声明减少52.5%,回复更简洁。已全量推送,付费用户可保留旧版本3个月过渡。
豆包披露付费方案:三档68-500元/月 字节豆包推出付费订阅,标准版68元/月、加强版200元/月、专业版500元/月,聚焦PPT生成/数据分析等生产力场景。免费版继续保留,差异化满足专业用户需求。
Claude深度集成Office:跨应用文档同步 Anthropic发布Claude for Microsoft 365,可在Excel/Word/PowerPoint间同步上下文,自动分类邮件并生成草稿。付费用户可用,提升办公协作效率。
百度文心5.1发布:预训练成本仅业界6% 百度发布文心大模型5.1,采用多维弹性预训练技术,以业界6%的预训练成本实现基础效果领先,搜索能力登LMArena国内第一。已上线千帆平台面向企业开放。
阶跃星辰推实时语音:支持情绪感知+人设自定义 阶跃星辰发布StepAudio 2.5 Realtime,可感知语调/语速/停顿等副语言信息,支持开发者通过API自定义角色性格。真人对话评分80.41,高于竞品。
中国移动上线8万+数智员工:推移动版智能助理 报道中国移动披露已上线超8万名数智员工,将推移动版智能助理升级App/云电脑等入口。聚焦网络鉴伪/研发设计/营销服务等场景落地。
开发与技术进展
腾讯开源多模态搜索方案:7项基准平均提升10%+ 腾讯混元联合高校发布OpenSearch-VL,通过强化学习训练多模态深度搜索智能体,构建3.6万条指令微调数据。在7项基准测试中平均性能提升超10个百分点。
开源地址:https://github.com/shawn0728/OpenSearch-VL
谷歌推MTP起草器:Gemma 4推理提速3倍 谷歌为Gemma 4发布多Token预测起草器,利用推测解码架构,在不降质量前提下将推理速度最高提升3倍。本地设备测试达2.2倍加速,降低边缘部署门槛。
小米开源语音克隆模型:单模型覆盖 600+语种 小米AI实验室发布OmniVoice,仅用双向Transformer实现文本到语音直出,19语种测试相似度/可懂度超越商用系统。支持自定义音色与带噪音频适配。
OpenAI发布实时语音模型:具备GPT-5级推理能力 OpenAI推出GPT-Realtime-2/Translate/Whisper三款模型,其中Realtime-2具备GPT-5级推理能力,支持对话中调用工具与处理打断。输入定价32美元/百万Token。
商汤推轻量化多模态模型:Token消耗降60%报道商汤发布SenseNova 6.7 Flash-Lite,取消视觉转文本中间层,信息搜索场景Token消耗直降60%,实现毫秒级反馈。已开源SenseNova-Skills办公技能套件。
商汤发布日日新SenseNova 6.7 Flash-Lite,Token消耗直降 60%,Token Plan同步开放
蚂蚁百灵发万亿级模型:支持推理强度自定义 报道蚂蚁百灵发布Ring-2.6-1T,引入Reasoning Effort机制支持high/xhigh两种推理强度。PinchBench得分87.60超越竞品,已开放限时免费体验。
硬件与基础设施
AMD预览MI430X显卡:FP64性能超英伟达6倍报道AMD预览Instinct MI430X加速器,原生FP64算力超200 TFLOPs,预计达英伟达Rubin架构6倍以上。兼顾AI与传统HPC负载,服务气候学/材料科学等高精度场景。
新华三发万亿级超节点:支持16384卡扩展 报道新华三发布UniPoD S80000,覆盖32-1024卡全系列,最高可扩展至16384卡。搭配AI智算工具链,交付一站式智算解决方案。
紫光展锐发端边AI芯片:4nm工艺+降低 39% 成本紫光展锐发布N9系列,采用4nm工艺与Arm v9.2架构,帮助客户降低39% BOM成本、缩短67%开发周期。集成UniLLM GenAI与智能体框架。
新紫光推近存计算架构:存储带宽达30TB/s 新紫光发布"紫弦"三维化近存计算架构,以3D DRAM为核心首创3.5D异质集成方案,存储带宽达30TB/s。模拟显示Token吞吐率较英伟达B200高1.5-2倍。
群晖推AI监控摄像头:支持本地人流/车辆计数 群晖发布BC510/TC510,支持2880×1620@30FPS录制,内置边缘AI可本地运行人流与车辆计数、入侵侦测。具备IP66/67防护与30m夜视。
中国移动发模型服务平台:接入300+模型成本降30% 中国移动发布MoMA平台,接入超300款主流AI模型,首创Token集约化运营模式。基于国产算力部署,单位Token成本压降约30%,支持秒级故障切换。
资本与行业趋势
Anthropic拟融资数百亿:估值冲击1万亿美元 Anthropic考虑今夏筹集数百亿美元扩展算力,融资前估值达9000亿美元,有望超越OpenAI。年化收入预计超450亿美元,投资者希望在年底前建立持仓。
阶跃星辰完成25亿美元融资:加速赴港IPO 阶跃星辰接近完成25亿美元融资,华勤/龙旗/豪威/中兴等产业链资本参投,香港投资管理有限公司加入。已完成红筹架构拆除,进入港股上市筹备期。
月之暗面获20亿美元融资:估值突破200亿美元 Kimi完成约20亿美元新融资,美团龙珠领投,投后估值突破200亿美元。不到半年累计融资超39亿美元,年度经常性收入4月已超2亿美元。
OpenAI算力预算飙至500亿:2030年或达6000亿美元 OpenAI总裁披露今年算力开支预计达500亿美元,较2017年3000万美元增长数千倍。长期目标2030年累计计算投入约6000亿美元,支撑下一代模型研发。
Anthropic签谷歌2000亿协议:占云收入40%+ Anthropic承诺五年内向谷歌云支出2000亿美元,占谷歌披露未实现收入的40%以上。此前已与亚马逊签超1000亿美元算力采购协议,锁定头部云厂商资源。
软银缩减OpenAI质押贷款:目标降至60亿美元 软银调整以OpenAI持股作抵押的贷款计划,目标规模从100亿美元下调至60亿美元。部分债权人对未上市股权定价缺乏信心,反映资本市场对高估值资产趋于审慎。
政策与社会影响
三部门印发智能体实施意见:明确19个应用场景 网信办/发改委/工信部联合发布《智能体规范应用与创新发展实施意见》,提出夯实基础/守牢安全/强化应用/建设生态四方面举措,明确19个典型应用场景。
工信部启动伦理审查先导计划:探索落地路径 工信部印发通知启动人工智能科技伦理审查与服务先导计划,依托产业创新应用先导区率先探索审查落地路径。部署细化制度/建设委员会/开展实践/构建治理网络四项任务。
欧盟达成AI法案临时协议:高风险合规延至2027年 欧盟成员国与议会就"弱化版"人工智能法案达成临时协议,高风险系统合规时间推迟至2027年12月。禁止利用AI制作未经授权色情深度伪造内容,强制水印规定12月实施。
全国首例AI短剧侵权案宣判:盗录 1700+ 部获刑 广州黄埔区法院一审宣判全国首例AI短剧侵权刑事案件,被告盗录超1700部短剧牟利,判处有期徒刑8个月缓刑1年2个月并处罚金。法院认定AI短剧符合著作权法作品标准。
上海启动AI安全监管试点:发布"红队"智能体 上海市互联网协会成立人工智能工作委员会,启动"人工智能赋能安全监管"试点。谋乐网络展示AI红队智能体"Elliot",可嵌入监管链条提供技术支持。
IMF警示AI放大金融风险:呼吁加强国际协调 IMF发布报告称,先进AI模型能以更低成本快速识别利用系统漏洞,网络攻击风险正变得更具系统性。呼吁各国将网络安全视为金融稳定核心议题,加强国际协调。
夜雨聆风