今天Ars Technica发了一篇文章,重新把一件三月份的事拉回了视野:苹果正在把谷歌Gemini的能力蒸馏进iPhone。

这件事的背景是苹果和Siri的困境。Apple Intelligence发布两年了,承诺过的个性化Siri功能一再推迟,WWDC 2026下周就开幕,外界普遍在等苹果给出答案。
今年1月,苹果与谷歌签署多年合作协议,谷歌给了苹果"完整访问权限",可以在苹果自己的数据中心对Gemini进行蒸馏——把万亿参数规模的大模型压缩成能在iPhone上运行的小模型。苹果每年为此支付约10亿美元。从用户角度看不到任何谷歌的痕迹,这套东西全部以Siri的名义出现。

3月25日,新的进展确认:苹果已经可以让Gemini执行一系列任务、输出高质量结果,然后把答案和推理过程一起喂给更小的模型训练。这叫"蒸馏"——学生模型不只学答案,也学老师推理的方式。最终得到的,是一个小到可以在iPhone上本地运行、但能力接近大模型的东西,而且全程不需要联网。
苹果做了多年的隐私承诺,在这套设计里是认真的——所有计算在苹果自己的Private Cloud Compute上跑,用户数据不传给谷歌。这和ChatGPT集成的方式截然不同,ChatGPT集成要用户自己opt in接受OpenAI的数据政策,Gemini这套完全在苹果的基础设施里。
与此同时,开发者工具链这边也在闹兼容性问题,方向不同,但值得一提。
OpenCode(一个把Claude Code、Codex、Cursor等工具接入免费模型的第三方代理层)发现,DeepSeek V4 Flash在思考模式下有一个强制字段reasoning_content,必须在API调用里传回去,但OpenCode的代理逻辑没有处理这个字段,导致请求直接返回400错误。
说清楚这件事的性质:问题不在Claude Code本身,也不在DeepSeek V4。DeepSeek官方提供了Anthropic兼容的API端点,开发者直接配置四个环境变量,Claude Code就可以正常跑DeepSeek V4 Pro,而且价格比Opus便宜很多倍。问题出在中间的代理层——OpenCode在转发请求时没有正确处理DeepSeek的特定字段要求。
这两件事放在一起,说明了同一个现象:AI工具链越来越复杂,每一层接口都在做各自的假设,一旦某一层换了模型或者加了新字段,底下就可能塌。
苹果在用蒸馏解决大模型和手机之间的兼容性问题,开发者在用环境变量解决Claude Code和DeepSeek之间的兼容性问题。规模不同,但本质一样——让不同来源的AI能力在同一个地方好好工作,比看起来要难。
关注我,这里是普洛克Prock,专注记录AI的发展脉络与实时前沿。

夜雨聆风