苹果要把谷歌的模型塞进iPhone,AI工具链的兼容性问题也来了

今天Ars Technica发了一篇文章，重新把一件三月份的事拉回了视野：苹果正在把谷歌Gemini的能力蒸馏进iPhone。

这件事的背景是苹果和Siri的困境。Apple Intelligence发布两年了，承诺过的个性化Siri功能一再推迟，WWDC 2026下周就开幕，外界普遍在等苹果给出答案。

今年1月，苹果与谷歌签署多年合作协议，谷歌给了苹果"完整访问权限"，可以在苹果自己的数据中心对Gemini进行蒸馏——把万亿参数规模的大模型压缩成能在iPhone上运行的小模型。苹果每年为此支付约10亿美元。从用户角度看不到任何谷歌的痕迹，这套东西全部以Siri的名义出现。

3月25日，新的进展确认：苹果已经可以让Gemini执行一系列任务、输出高质量结果，然后把答案和推理过程一起喂给更小的模型训练。这叫"蒸馏"——学生模型不只学答案，也学老师推理的方式。最终得到的，是一个小到可以在iPhone上本地运行、但能力接近大模型的东西，而且全程不需要联网。

苹果做了多年的隐私承诺，在这套设计里是认真的——所有计算在苹果自己的Private Cloud Compute上跑，用户数据不传给谷歌。这和ChatGPT集成的方式截然不同，ChatGPT集成要用户自己opt in接受OpenAI的数据政策，Gemini这套完全在苹果的基础设施里。

与此同时，开发者工具链这边也在闹兼容性问题，方向不同，但值得一提。

OpenCode（一个把Claude Code、Codex、Cursor等工具接入免费模型的第三方代理层）发现，DeepSeek V4 Flash在思考模式下有一个强制字段reasoning_content，必须在API调用里传回去，但OpenCode的代理逻辑没有处理这个字段，导致请求直接返回400错误。

说清楚这件事的性质：问题不在Claude Code本身，也不在DeepSeek V4。DeepSeek官方提供了Anthropic兼容的API端点，开发者直接配置四个环境变量，Claude Code就可以正常跑DeepSeek V4 Pro，而且价格比Opus便宜很多倍。问题出在中间的代理层——OpenCode在转发请求时没有正确处理DeepSeek的特定字段要求。

这两件事放在一起，说明了同一个现象：AI工具链越来越复杂，每一层接口都在做各自的假设，一旦某一层换了模型或者加了新字段，底下就可能塌。

苹果在用蒸馏解决大模型和手机之间的兼容性问题，开发者在用环境变量解决Claude Code和DeepSeek之间的兼容性问题。规模不同，但本质一样——让不同来源的AI能力在同一个地方好好工作，比看起来要难。

关注我，这里是普洛克Prock，专注记录AI的发展脉络与实时前沿。