AI日报:Claude Opus 4.8发布/小米超大众丰田成全球新能源第七/小米MiMo罗福莉:MiMo API 降价来自更低推理成本

点击上方蓝字关注我们

Claude Opus 4.8

Anthropic 正式推出旗舰模型 Claude Opus 4.8，距离前代 Opus 4.7 发布仅 41 天，在 AI 大模型竞争持续升温的当下，再次展现了快速迭代的节奏。此次升级并未调整定价，却在编程、AI 智能体任务、推理和知识工作等核心能力上实现了显著提升，同时针对 AI 的诚实性与判断力进行了重点优化。Claude Opus 4.8 的核心改进集中在可靠性与诚实性层面。官方评估数据显示，相比前代模型，Opus 4.8 放任自身代码缺陷未经说明通过的概率降至四分之一，更愿意主动标注不确定性，减少缺乏依据的结论。

小米超大众丰田成全球新能源第七

2026 年第一季全球纯电动车、插电混合式电动车及氢燃料电池车等新能源车合计销量达 394 万辆，较去年同期下滑 2%，占第一季全球汽车总销量的 19%。在纯电动车销售排名中，特斯拉超越比亚迪重回冠军宝座，这一变化颇受行业关注。分居第二至四名的比亚迪、吉利、上汽通用五菱，销量均较去年同期出现下滑，本土市场的调整态势直接影响了这些品牌的表现。不过，排名第五的零跑却凭借快速扩张的产品矩阵及高性价比策略，逆势实现销量年增长，成为中系品牌中的一抹亮色。此外，起亚和丰田凭借多市场布局的抗风险能力，本季排名有所提升；小米则以 2.9% 的市场份额超越大众、丰田，位居纯电市场第七名，新势力的入局进一步搅动了市场格局。

罗福莉：MiMo API 降价来自更低推理成本

小米 MiMo 官方宣布旗下 MiMo-V2.5 系列 API 迎来永久降价，相比原始定价最高降幅可达 99%。小米 MiMo 负责人罗福莉随后在 X 平台发文，揭开了降价背后的技术逻辑。她表示，MiMo 的原始推理成本远低于行业平均水平，新价格基本可以维持收支平衡。核心优势来自模型与系统的双重优化：在系统层面，通过 SGLang HiCache 与 SWA 机制，KV Cache 数据搬运量降至原水平的 1/7，可缓存 token 数量提升近 5 倍，结合专家并行与输入长度分桶策略，集群吞吐能力大幅提升，单位 token 服务成本显著降低；在模型架构层面，MiMo-V2.5-Pro 采用 1:7 的 Full:SWA 稀疏比，70 层模型的 prefill 计算量仅相当于 10 层 GQA 模型，进一步压缩了推理效率成本，罗福莉同时建议同行不要盲目降价。

具身大模型 Wall-OSS-0.5

自变量机器人正式发布并开源了具身大模型 Wall-OSS-0.5，这款定位为「预训练一次，随处部署」的视觉 - 语言 - 动作（VLA）模型，打破了具身智能领域长久以来的行业惯例 —— 预训练完成后无需任何任务微调即可直接上机部署。根据官方公布的测试数据，Wall-OSS-0.5 在 17 个真机零样本任务中，有 4 个任务的自主完成率超过 80%；在十余个真实机器人任务的公平对比中，其操作类和推理类任务表现均领先于同类开源模型。更值得关注的是，这款模型不仅在分拣、堆叠等结构化操作上达到了实用水平，甚至在从未接触过的绳索整理这类柔性操作任务中，也能保持稳定的表现，部分零样本泛化能力已接近常规微调后的模型水平，实现了全球范围内首次「预训练」比肩「后训练」的突破。

Qoder 推出全托管 AI Agent

里云旗下 Qoder 正式上线全托管 AI Agent 运行平台 Cloud Agents，为企业提供一站式的 Agent 能力落地解决方案。作为一款聚焦 AI Agent 开发与运行的托管服务，Cloud Agents 将 Agent 底座、模型服务及运行环境等全栈能力封装整合，企业只需通过 API 调用，就能让自身应用和业务系统快速具备智能化执行任务的能力。底层 Coding Agent 引擎驱动，具备理解复杂需求、调用外部工具、执行长程任务以及容错恢复等通用能力。企业无需改动现有业务系统的代码，就能将客服、运营、风控、运维等各类业务场景快速接入 Agent 能力，让业务流程实现智能化升级。

长按二维码识别关注