AI进入“成本效率、真实推理与社会规则”竞争期

01｜小米开源MiMo-V2.5-Pro，主打“长时间自主编码”

小米推出开源权重模型 MiMo-V2.5-Pro，The Decoder称其在编码能力上接近 Anthropic Claude Opus 4.6，并且在运行同类任务时可节省 40%—60% token。更值得注意的是，它主打“hours-long autonomous coding”，也就是让模型在较长时间内持续完成编码任务，而不是只回答一次问题。

这条新闻重要的地方在于，AI Agent竞争正在从“谁分数更高”转向“谁能更便宜、更久地持续工作”。如果开源模型也能低成本完成长任务，企业部署Agent的门槛会明显下降。

📌 关键词：小米 / MiMo-V2.5-Pro / 开源模型 / 自主编码

02｜xAI发布Grok 4.3，价格大降并强化工具调用

xAI发布 Grok 4.3，定位开发者和企业用户。The Decoder称，该模型可自主执行网页搜索、X搜索、Python代码、文件检索，并能生成Excel、PDF和PPT。支持 100万token上下文窗口，速度约 100 token/s，价格为每百万输入token 1.25美元、输出token 2.50美元。

这条新闻说明，AI模型正在进入“能力够用 + 成本极低”的竞争区间。Grok 4.3不是最强模型，但如果它在成本、速度和工具调用上足够好，会推动中端Agent大规模普及。

📌 关键词：xAI / Grok 4.3 / 低价模型 / 工具调用

03｜MIT研究解释：为什么大模型扩展一直有效

MIT相关研究试图解释“为什么模型越大、数据越多，语言模型就越可靠地变强”。The Decoder报道，研究者构建了一个简化AI模型，并通过控制概念之间的重叠程度，观察模型从记忆到泛化的变化。

这类研究看起来不如模型发布热闹，但对AI进化非常关键。过去大模型扩展很多时候像“经验主义”：堆参数、堆数据、堆算力。现在学界开始尝试解释扩展律背后的机制，这会影响下一代模型架构、训练策略和数据组织方式。

📌 关键词：MIT / Scaling Law / 模型扩展 / 训练机制

04｜ARC-AGI-3显示：前沿模型仍然缺少真正的世界模型

ARC Prize Foundation分析了GPT-5.5和Claude Opus 4.7在ARC-AGI-3上的160次游戏运行。结果显示，所有前沿模型得分仍低于1%：GPT-5.5约0.43%，Opus 4.7约0.18%。分析指出，模型会抓住局部规律，却难以形成稳定的整体世界模型，还会把陌生机制误判成训练数据里的旧游戏。

这条新闻非常重要，因为它提醒我们：现在模型能写代码、能做研究，但在主动探索、因果理解、连续试错上仍有明显短板。

📌 关键词：ARC-AGI-3 / GPT-5.5 / 世界模型 / 推理短板

05｜美国CAISI报告称中国AI落后8个月，但价格优势可能更关键

The Decoder报道，美国Center for AI Standards and Innovation（CAISI）的新报告认为，中国AI模型相对美国模型出现落后，差距约为8个月。不过报道也提醒，独立数据并不完全支持这一判断，而且中国模型真正有竞争力的地方，可能不是绝对智力分数，而是DeepSeek等模型带来的价格优势。

这条新闻的价值在于，它把AI竞争从“谁最聪明”拉回现实：未来AI生态的胜负，可能同时取决于能力、成本、开源生态、推理价格和部署速度。

📌 关键词：CAISI / 中美AI竞争 / DeepSeek / 成本优势

06｜Google意外泄露COSMO，本地AI助手路线浮出水面

Google被曝短暂上架未发布的COSMOAI助手App，随后又下架。Times of India援引9to5Google称，该App由Google Research开发，体积约1.13GB，内置本地Gemini Nano模型，并包含14个AI Skills，包括Deep Research、Mariner浏览器Agent、日历事件建议、对话总结等。

这条新闻值得关注，因为它代表AI助手正在向“端侧 + 云端混合”演化。未来手机AI不只是聊天窗口，而可能变成能看屏幕、读上下文、操作浏览器和安排日程的本地智能体。

📌 关键词：Google COSMO / Gemini Nano / 端侧AI / 手机Agent

07｜Cerebras冲刺40亿美元IPO，AI芯片替代路线继续升温

据Bloomberg消息，AI芯片公司Cerebras Systems计划IPO，目标最高融资40亿美元，估值约400亿美元。报道还称，该公司准备很快启动正式路演，承销方已收到超过100亿美元的潜在订单意向。

这条新闻说明，AI芯片市场仍然在寻找NVIDIA之外的新路线。Cerebras的晶圆级芯片架构与传统GPU不同，如果资本市场愿意给它400亿美元估值，说明“非GPU算力路线”仍被视为AI基础设施的重要变量。

📌 关键词：Cerebras / AI芯片 / 40亿美元IPO / 算力替代

08｜中国法院裁定：企业不能只因AI替代而裁员

杭州中级人民法院相关案例显示，企业不能仅以AI自动化为理由单方面解雇员工或降薪。Times of India报道称，该案中，一家科技公司在员工拒绝因岗位被AI自动化而降职后将其解雇，法院认定该解雇不合法。

这条新闻表面是劳动争议，背后是AI进入就业体系后的第一批制度边界。AI可以提升效率，但企业不能简单把“技术进步”当作随意裁员理由。未来AI落地速度，不仅取决于技术，还取决于劳动法、社会稳定和企业责任。

📌 关键词：中国法院 / AI裁员 / 劳动关系 / 社会规则

09｜新伦理基准显示：不同前沿模型有不同“道德倾向”

一项名为Philosophy Bench的新测试，将OpenAI、Anthropic、Google、xAI等前沿模型放入100个日常伦理困境中，观察它们更偏向结果主义还是义务论。The Decoder指出，这类测试背后的真正问题是：当AI进入销售、医疗、工作流程和组织决策时，究竟由谁决定AI该遵循什么价值观。

这条新闻重要在于，AI越像Agent，越需要在模糊场景中做选择。模型不只是“会不会答”，而是“它会按谁的伦理行动”。

📌 关键词：Philosophy Bench / 模型伦理 / 价值对齐 / Agent决策

10｜微软被曝在VS Code提交中自动加入Copilot署名，引发开发者反弹

The Decoder报道，微软曾在Visual Studio Code提交中加入“Co-Authored-by Copilot”标记，即使用户关闭AI功能也可能出现。相关开发者随后承认该功能不应在AI关闭时运行，也不应把非AI生成内容标记为AI参与，并表示将在1.119版本回滚默认设置。

这条新闻看似是一个开发工具争议，但影响不小：随着AI进入代码生产，谁写了代码、AI是否参与、版权和责任如何追踪，都会成为企业合规问题。

📌 关键词：Microsoft / Copilot / VS Code / AI署名

声明：本文仅整理公开信息，不构成任何投资建议。