
算力指数级增长 智能成为可计算的函数
微软AI负责人站在台上,说出了一组令人震撼的数字。从开始从事AI工作至今,用于训练前沿模型的计算量增加了1万亿倍——15年间,12个数量级的跃升。
这不是抽象的技术细节。它揭示了一个底层逻辑:计算能力的持续指数级增长,正在让AI能力变得可预测。未来几年,我们将见证另外三个数量级的算力被投入前沿模型的训练。
智能,现在已经成为计算量的函数。 对数线性爬坡已成为行业新常态,规模法则依然坚实成立。
这正是整个AI产业剧烈变动的根源。当智能可以被“计算”出来,规则的改变者就不再是某个特定的算法突破,而是整个产业链的整合与优化能力。
哲学先行 微软为何强调“人文超级智能”
在这轮AI竞赛中,微软明确了一个与众不同的定位:Humanist Superintelligence——人文超级智能。
这句话的关键解读在于后半句:明确设计为服务和赋能人类和组织,而非取代他们。
这并不是空洞的口号。它意味着微软的产品策略、模型设计、合作模式,都围绕一个核心原则展开:AI必须将人类福祉和进步置于首位,必须以人为本。
在一个充斥着“AI取代人类”焦虑的时代,微软选择了一条差异化道路。这既是哲学选择,也是市场策略——企业客户最恐惧的,恰恰是被通用AI“架空”或“挖角”自己的核心竞争力。
七款模型齐发 覆盖图像、语音、转录与代码
此次发布的核心是一口气推出的七款新模型,这显示了微软在前沿领域全面布局的决心。
MAI Image 2.5与Flash变体在图像编辑基准测试中排名第二,超越了Nano Banana 2的得分。Flash版本专为高效生产负载设计,2.5版本则追求最大保真度和专业级性能。目前已在PowerPoint中上线,并逐步在OneDrive中推出,且在Foundry平台上以极具竞争力的性价比提供服务。

MAI Transcribe 1.5被定位为全球最佳转录模型,在43种语言中达到最先进的准确率,击败了Gemini和OpenAI的旗舰转录模型。更关键的是,相比所有竞争对手,它的转录速度快了5倍,已经成为GitHub、Teams、Copilot、Dynamics 365 Contact Center等产品的底层技术支撑。
MAI Voice 2是语音生成模型的最新力作,具优美的韵律、自然的语调和精细的情绪控制能力,支持15种语言。配合推出的Voice 2 Flash版本,为2026年即将火爆的超低延迟语音代理场景提供了最佳性价比解决方案。
从零起步的推理模型 MAI Thinking 1的真正含金量
作为微软的首个推理模型,MAI Thinking 1的定位很特别。它是一款350亿活跃参数、256k上下文窗口的MoE模型,属于中等重量级,但表现远超其体量。

在独立人类评审的侧面对比测试中,MAI Thinking 1的整体质量优于Sonnet 4.6。 它在AME 2025上达到97%,在SWE Bench Pro上达到53%——与最顶尖的编码基准测试并肩。
但真正让微软骄傲的,并非这些数字本身。这个模型完全是从零开始自行爬升,没有针对任何特定基准进行优化,并且绝对没有使用任何蒸馏技术。
这意味着什么?意味着MAI Thinking 1拥有企业级的、干净的、商业许可的数据血缘。你可以信任地将其投入生产环境,不存在版权或数据来源的风险。
极致效率的编码模型 MAI Code 1 Flash
与Thinking 1形成互补的是MAI Code 1 Flash,一款专为VS Code和GitHub Copilot CLI优化的推理高效编码模型。
仅有50亿参数的它,在SWE Bench Pro上达到了51%的得分。 这意味着其尺寸接近Haiku,但成本更低——在极低的推理计算开销下,实现了极强的编码性能。目前已开始在VS Code中推出。

开放与安全并重 从芯片到生态的完整掌控
此次发布还有一个值得关注的细节:微软首次让开发者能够在OpenRouter、Fireworks、Baseten等第三方平台上直接调整模型权重。这意味着生态开放,不再局限于微软自有平台。
安全与信任方面,所有语音模型都具备防止未授权克隆的保护机制,所有内容从一开始就嵌入水印。微软还减少了过度拒答,改善了包括残障人士在内的用户代表性,并同步发布了详细的技术报告。
更关键的是,微软实现了模型与自研芯片的协同设计。 MAI Thinking 1运行在自研Maia 200芯片上,与GB-200进行正面对比测试后,在Satya此前提到的30%性能提升基础上,每瓦性能又额外提升了1.4倍。在大规模部署场景下,每一个瓦特都至关重要。芯片与模型的协同优化,将成为保持前沿竞争力的关键优势。
这些更高效的MAI模型即将登陆N1X平台,几个月内将在Windows上实现最佳性能。
护城河私有化 不租智能,只定制能力
真正让微软区别于竞争对手的,是其“全栈端到端拥有权”的理念。微软推出了“Frontier Tuning”,允许用户使用微软的全栈爬坡机器,在任意需要的地方定制MAI模型。
核心看点在于RLE(强化学习环境)——为AI打造的专属训练室。 这些环境能够创建公司和任务特有的智能体,完全适配于特定用户,构建在MAI模型之上。
微软内部的实践已经证明了这一路径的可行性:使用RLE结合MAI模型,在Excel上优化智能体应用,调优后的MAI模型在公开和私有基准上与GPT 5.4持平,同时成本效率提高了10倍。
与麦肯锡的合作案例更具说服力:针对麦肯锡的任务进行调优后,MAI不仅取得了最高胜率,甚至超过了GPT 5.5,同时再次实现了10倍的成本效率提升。
这里的底层逻辑非常重要:与其他公司不同,使用MAI时,你不是从一个共享模型中“租用”智能。 只有你保留自己辛苦积累的工作流、专有知识、机构数据的收益。只有你掌控最终生成的模型。RLE和其中构建的模型,最终将成为你真正的护城河。
最重要的应用 与梅奥诊所共筑医疗新前沿
整场发布会的压轴内容,是对AI最严肃应用——医疗健康的投入。微软宣布与梅奥诊所合作,联合开发医疗前沿模型,并部署到全球的医院中。
梅奥诊所CEO Gianrico Farrugia道出了合作的初衷:“全世界大多数人无法获得梅奥诊所的服务。七年前我们决定创建一个平台,将医疗从‘管道’转变为‘平台’。现在这个平台覆盖四大洲,触达约1亿人,拥有全球最大、最深的纵向医疗数据集——多模态,包括基因组数据。”
合作的核心在于:模型已经掌握了教科书级的知识和最新的学术论文,但缺乏真实的临床实践和临床专家多年积累的专有经验。 微软提供前沿模型技术和定制能力,梅奥提供全球最顶尖的临床数据和实践经验。双方各司其职,共同攻克医疗领域长期以来难以解决的痛点——可信、可扩展的解决方案。
“把患者放在首位”不再是一句口号,而是模型设计和部署的顶层原则。
总结 新AI时代的真正起点
微软在此次发布中展示了一个清晰的战略图景:AI不是通用智能的竞赛,而是定制化智能的战场。
七款新模型覆盖了从图像到语音、从转录到代码的关键节点。模型与芯片的协同设计代表了效率导向的技术路径。RLE和Frontier Tuning则定义了企业与AI协作的新范式——你不必担心被替代,因为你拥有完全掌控权。
与梅奥诊所的合作,更将这一逻辑延伸到最具社会价值的领域。在医疗这种高风险、高复杂性、高情感附加值的场景中,让人放心的、可信赖的、专属于特定机构与患者的AI,比任何通用“超级智能”都更有意义。
正如微软所言:“AI的新时代,是你掌控的、按你的条件运行的AI时代。”
这句话的背后,是对未来AI产业格局的深刻判断——当智能变成可计算的函数,真正的竞争壁垒不在于算力本身,而在于谁能用算力构建出专属的知识和工作流护城河。
金句卡片
“智能,现在已经成为计算量的函数。”
“你不必从共享模型中‘租用’智能。只有你保留收益,只有你掌控模型。”
“你的护城河,只能你自己挖。”
“模型已经掌握了教科书,但缺乏真实的临床实践。”
“AI的新时代,是你掌控的、按你的条件运行的AI时代。”
Source: https://www.youtube.com/watch?v=OvLIae4HCeM
夜雨聆风