Codex 教你写原生 iOS/MacOS App

OpenAI 官方发了篇指南，教你怎么用 Codex 写 iOS/macOS 原生应用。我第一反应是：终于来了。第二反应是：等等，这事没那么简单。

我花了一个周末把官方指南、社区实测、以及几位头部 iOS 开发者的经验都捋了一遍。结论先摆这儿：Codex 确实能写 iOS 应用了，但离"好用"还有一截。

省流版：

Codex 官方出了 iOS/macOS 开发指南，核心是 SwiftUI + xcodebuild + XcodeBuildMCP
XcodeBuildMCP 是关键桥梁，已被 Sentry 收购，4000+ GitHub Stars
Claude Code 在 SwiftUI 代码质量上仍然领先，Codex 强在"探索"和批量任务
真正的 iOS 老手，两个都在用，按任务类型分工
Liquid Glass（iOS 26 新设计）让事情更复杂了
讽刺的是，Codex App 自己是 Electron 做的，不是原生

先说官方指南到底说了啥

OpenAI 开发者网站上挂了一篇《Build for iOS and macOS》，讲的是用 Codex 跑 SwiftUI 项目的最佳实践。

就这么三步：

第一步，绿色项目直接让它搭。 新建一个 SwiftUI 项目，Codex 会帮你把骨架和构建脚本都写好。这个阶段不需要任何额外工具，纯 prompt 就行。

第二步，构建循环必须 CLI 化。 Apple 的 xcodebuild 可以在终端里完成构建、测试、打包全流程，Codex 不用跳出终端去碰 Xcode GUI。如果你觉得 xcodebuild 太原始，可以用 Tuist 做项目管理，同样不依赖 GUI。

第三步，活多了上 XcodeBuildMCP。 等你进入一个完整的 Xcode 工程了，需要操作 simulator、截图、看 log、点 UI，shell 命令就不够用了。这时候接上 XcodeBuildMCP，81 个工具、16 个工作流组，基本覆盖了 iOS 开发的完整闭环。

官方还推荐了一堆 Codex Skills：SwiftUI expert、SwiftUI Pro、Liquid glass expert、SwiftUI performance、Swift concurrency expert……

听起来很全对吧？但问题是，指南是 OpenAI 写的，体验是开发者验证的。这两件事之间，隔着十万八千里。

XcodeBuildMCP：没它啥都干不了

说句实在话，AI 写 iOS 代码最大的障碍从来不是写 Swift，而是跑 Xcode。

这是 Paul Solt 在 LinkedIn 上说的一句话，我觉得说到根子上了。你让 Codex 写一段 SwiftUI 代码，它能写。但你让它编译、跑起来、看看 UI 对不对？不好意思，Xcode 的 scheme、target、simulator destination 这三样东西，没一个是能猜出来的。

这就是 XcodeBuildMCP 存在的意义。

它是干嘛的？一个 MCP 服务器，把 Xcode 的操作暴露给 AI agent。构建、运行、测试、截图、调试、UI 自动化操作（点、滑、输入），81 个工具全都有。

谁做的？Cameron Cooke，一个人搞出来的开源项目。2026 年 2 月 Sentry 把它收了，Cameron 也跟着加入了 Sentry。收的时候已经 4000+ GitHub Stars，社区非常活跃。

为什么这么重要？因为 xcodebuild 一次构建的输出能有 1.2MB+，AI agent 的上下文窗口直接被撑爆。49-57% 的 shell-based 任务会命中截断限制。而 XcodeBuildMCP 的 build_sim 过滤了输出，只留警告和错误，中位数 2.1KB，压缩了 99.8%。

Cameron 后来在 Sentry 工程博客上跑了 1350 次试验对比，总结了一句话：

"完成任务和确认你正确完成了任务，是两件不同的事。"

这话扎心。你让 AI 写代码，它写了。但到底写对了没有？它自己不知道。XcodeBuildMCP 干的就是这个事：帮 AI 验证自己。

Codex vs Claude Code：iOS 开发者的真实体验

Reddit 上有个帖子，一个开发者同时用了 Codex 和 Claude Code 做 Xcode 项目，原话是这么说的：

"Claude Code 基本上总是给我最干净的代码。Codex 倾向于过度工程化，代码即使能跑，也几乎没法读。"
"但有时候 Claude 卡住了搞不定的问题，Codex 一把就过了。"
"我两个都是 $20/月的档，Codex 从来不撞限额，Claude Code 天天撞。"

Thomas Ricouard，Ivory（Mastodon 客户端）的作者，可能是最有代表性的 iOS 开发者。他的判断更直白：

"论代码质量，没有东西比得过 Claude。而且它特别擅长 SwiftUI——总能找到正确的方式，修好问题，完成需求。"
"但我发现 Codex 擅长'发现'——探索代码库、理解结构，不需要你喂太多上下文。"

他自己两个都用。Claude 做精细活（SwiftUI、UI 调整），Codex 做粗活（代码探索、批量 feature）。

还有一个有趣的观察，来自 Lukasz Kuczborski：

"虽然我更喜欢 Codex App 的界面，但 Claude 能发现 Codex 发现不了的 SwiftUI 细微错误。"

如果用一句人话总结：Claude 是那个写代码又快又好的实习生，Codex 是那个虽然代码糙但从不撞限额的实习生。聪明的老板，两个都留。

Liquid Glass：苹果给你们挖了个新坑

iOS 26 的 Liquid Glass 设计语言，苹果自己说是"自 iOS 7 以来最大的设计变革"。

社区的反应两极分化。Reddit 上有人发帖"我其实挺喜欢 Liquid Glass 的"，底下评论区一堆人骂。MacRumors 专门写了篇文章标题就是"Liquid Glass 引发用户批评"。

对开发者来说，这不是审美问题，是工作量问题。

Liquid Glass 改了整个 UI 渲染方式。你的 SwiftUI 代码在 iOS 25 上跑得好好的，升到 iOS 26 可能就面目全非了。UIKit 和 SwiftUI 混用的项目尤其头疼。

Codex 官方也注意到了这事，专门搞了个"Liquid glass expert" skill，让 agent 理解新的 Liquid Glass API，帮你把组件适配到新版本。

但这恰恰暴露了一个更深层的问题：苹果自己每年都在改 UI 框架，AI 模型的训练数据永远是滞后的。你的 Codex 学会了 iOS 25 的最佳实践，iOS 26 就变了。这个时间差，靠 skill 补，能补多少？

Thomas Ricouard 说了一句特别到位的话：

"我 2025 年大概只有 2% 的时间真的在 Xcode 里。"

他不是不用 Xcode，而是 Xcode 的角色变了——从"写代码的地方"变成了"验证代码的地方"。写代码在 Cursor + Claude Code 里完成，Xcode 只负责最后确认。

这个趋势对 Codex 来说是个好消息，因为它本身就是 CLI-first 的设计，刚好对上了这个新方向。

最讽刺的一件事

Codex App 是 OpenAI 2026 年 2 月发布的 macOS 应用。开发者用它来写 iOS 原生应用。

但 Codex App 自己呢？Electron 做的。

一个教你怎么写原生应用的工具，自己不是原生的。

Reddit 上有个开发者实在受不了了，自己用 Swift 重写了一个 Codex 的 macOS 客户端，发到 r/codex 版块，标题是"I rebuilt the Codex app as a native Swift macOS client"。

这事的荒诞程度，大概就跟一个健身教练自己从不健身差不多。

@ScriptedAlchemy 在 Twitter 上说得更直接：

"Codex 连个 iOS App 都没有，这让我对 AI 实验室'懂开发者'这件事，非常没有信心。"

话糙理不糙。

实际操作建议

说了这么多问题，不代表不能用。相反，现在就是最好的上手时机。

如果你是 iOS 新手：

直接用 Codex 起步。它对新手更友好——不需要你了解太多上下文，它会自己探索。配合 XcodeBuildMCP，从 scaffold 到 build 到 simulator 跑起来，一条龙。$20/月的额度基本够用。

如果你是老 iOS 开发者：

两个都用。Claude Code 做精细的 SwiftUI 工作，Codex 做探索和批量任务。XcodeBuildMCP 是必装的——一个命令就能配好：npx -y xcodebuildmcp@latest mcp。

如果你在带队：

关注 Sentry 的动向。XcodeBuildMCP 现在在 Sentry 手里，而且 Sentry 明确说了要持续投入移动端工具。加上 Xcode 26.3 已经原生支持 Claude 和 Codex agent，苹果自己在推这个方向。

所有人的共同建议：

保持 CLI-first 的工作流。Xcode GUI 只在最后验证阶段用。Thomas Ricouard 的模式值得参考：Cursor/Claude Code 写代码 → XcodeBuildMCP 构建 → Simulator 验证 → Xcode 最后确认。

最后的话

Codex 能写 iOS 应用了，这是事实。

但"能写"和"写得好"之间，隔着 XcodeBuildMCP、SwiftUI 的最佳实践、Liquid Glass 的适配、以及"你怎么确认自己写对了"这个根本问题。

真正让我觉得有意思的，不是 Codex 多强或者 Claude 多好，而是 iOS 开发的工作流本身在变。

以前你打开 Xcode，写代码、编译、调试，全在一个 IDE 里完成。

现在？Xcode 变成了验证工具，写代码在 Cursor 里、调试在终端里、agent 替你跑循环。Thomas Ricouard 说他只有 2% 的时间在 Xcode 里——一年前这种话会被当笑话，现在已经没人笑了。

"完成任务和确认你正确完成了任务，是两件不同的事。"

AI 编程的每一步进化，从 Copilot 到 Cursor 到 Codex，缩短的都是这个距离。