OpenAI 官方发了篇指南,教你怎么用 Codex 写 iOS/macOS 原生应用。我第一反应是:终于来了。第二反应是:等等,这事没那么简单。
我花了一个周末把官方指南、社区实测、以及几位头部 iOS 开发者的经验都捋了一遍。结论先摆这儿:Codex 确实能写 iOS 应用了,但离"好用"还有一截。
省流版:
Codex 官方出了 iOS/macOS 开发指南,核心是 SwiftUI + xcodebuild + XcodeBuildMCP XcodeBuildMCP 是关键桥梁,已被 Sentry 收购,4000+ GitHub Stars Claude Code 在 SwiftUI 代码质量上仍然领先,Codex 强在"探索"和批量任务 真正的 iOS 老手,两个都在用,按任务类型分工 Liquid Glass(iOS 26 新设计)让事情更复杂了 讽刺的是,Codex App 自己是 Electron 做的,不是原生
先说官方指南到底说了啥
OpenAI 开发者网站上挂了一篇《Build for iOS and macOS》,讲的是用 Codex 跑 SwiftUI 项目的最佳实践。
就这么三步:
第一步,绿色项目直接让它搭。 新建一个 SwiftUI 项目,Codex 会帮你把骨架和构建脚本都写好。这个阶段不需要任何额外工具,纯 prompt 就行。
第二步,构建循环必须 CLI 化。 Apple 的 xcodebuild 可以在终端里完成构建、测试、打包全流程,Codex 不用跳出终端去碰 Xcode GUI。如果你觉得 xcodebuild 太原始,可以用 Tuist 做项目管理,同样不依赖 GUI。
第三步,活多了上 XcodeBuildMCP。 等你进入一个完整的 Xcode 工程了,需要操作 simulator、截图、看 log、点 UI,shell 命令就不够用了。这时候接上 XcodeBuildMCP,81 个工具、16 个工作流组,基本覆盖了 iOS 开发的完整闭环。
官方还推荐了一堆 Codex Skills:SwiftUI expert、SwiftUI Pro、Liquid glass expert、SwiftUI performance、Swift concurrency expert……
听起来很全对吧?但问题是,指南是 OpenAI 写的,体验是开发者验证的。这两件事之间,隔着十万八千里。
XcodeBuildMCP:没它啥都干不了
说句实在话,AI 写 iOS 代码最大的障碍从来不是写 Swift,而是跑 Xcode。
这是 Paul Solt 在 LinkedIn 上说的一句话,我觉得说到根子上了。你让 Codex 写一段 SwiftUI 代码,它能写。但你让它编译、跑起来、看看 UI 对不对?不好意思,Xcode 的 scheme、target、simulator destination 这三样东西,没一个是能猜出来的。
这就是 XcodeBuildMCP 存在的意义。
它是干嘛的?一个 MCP 服务器,把 Xcode 的操作暴露给 AI agent。构建、运行、测试、截图、调试、UI 自动化操作(点、滑、输入),81 个工具全都有。
谁做的?Cameron Cooke,一个人搞出来的开源项目。2026 年 2 月 Sentry 把它收了,Cameron 也跟着加入了 Sentry。收的时候已经 4000+ GitHub Stars,社区非常活跃。
为什么这么重要?因为 xcodebuild 一次构建的输出能有 1.2MB+,AI agent 的上下文窗口直接被撑爆。49-57% 的 shell-based 任务会命中截断限制。而 XcodeBuildMCP 的 build_sim 过滤了输出,只留警告和错误,中位数 2.1KB,压缩了 99.8%。
Cameron 后来在 Sentry 工程博客上跑了 1350 次试验对比,总结了一句话:
"完成任务和确认你正确完成了任务,是两件不同的事。"
这话扎心。你让 AI 写代码,它写了。但到底写对了没有?它自己不知道。XcodeBuildMCP 干的就是这个事:帮 AI 验证自己。
Codex vs Claude Code:iOS 开发者的真实体验
Reddit 上有个帖子,一个开发者同时用了 Codex 和 Claude Code 做 Xcode 项目,原话是这么说的:
"Claude Code 基本上总是给我最干净的代码。Codex 倾向于过度工程化,代码即使能跑,也几乎没法读。"
"但有时候 Claude 卡住了搞不定的问题,Codex 一把就过了。"
"我两个都是 $20/月的档,Codex 从来不撞限额,Claude Code 天天撞。"
Thomas Ricouard,Ivory(Mastodon 客户端)的作者,可能是最有代表性的 iOS 开发者。他的判断更直白:
"论代码质量,没有东西比得过 Claude。而且它特别擅长 SwiftUI——总能找到正确的方式,修好问题,完成需求。"
"但我发现 Codex 擅长'发现'——探索代码库、理解结构,不需要你喂太多上下文。"
他自己两个都用。Claude 做精细活(SwiftUI、UI 调整),Codex 做粗活(代码探索、批量 feature)。
还有一个有趣的观察,来自 Lukasz Kuczborski:
"虽然我更喜欢 Codex App 的界面,但 Claude 能发现 Codex 发现不了的 SwiftUI 细微错误。"
如果用一句人话总结:Claude 是那个写代码又快又好的实习生,Codex 是那个虽然代码糙但从不撞限额的实习生。聪明的老板,两个都留。
Liquid Glass:苹果给你们挖了个新坑
iOS 26 的 Liquid Glass 设计语言,苹果自己说是"自 iOS 7 以来最大的设计变革"。
社区的反应两极分化。Reddit 上有人发帖"我其实挺喜欢 Liquid Glass 的",底下评论区一堆人骂。MacRumors 专门写了篇文章标题就是"Liquid Glass 引发用户批评"。
对开发者来说,这不是审美问题,是工作量问题。
Liquid Glass 改了整个 UI 渲染方式。你的 SwiftUI 代码在 iOS 25 上跑得好好的,升到 iOS 26 可能就面目全非了。UIKit 和 SwiftUI 混用的项目尤其头疼。
Codex 官方也注意到了这事,专门搞了个"Liquid glass expert" skill,让 agent 理解新的 Liquid Glass API,帮你把组件适配到新版本。
但这恰恰暴露了一个更深层的问题:苹果自己每年都在改 UI 框架,AI 模型的训练数据永远是滞后的。你的 Codex 学会了 iOS 25 的最佳实践,iOS 26 就变了。这个时间差,靠 skill 补,能补多少?
Thomas Ricouard 说了一句特别到位的话:
"我 2025 年大概只有 2% 的时间真的在 Xcode 里。"
他不是不用 Xcode,而是 Xcode 的角色变了——从"写代码的地方"变成了"验证代码的地方"。写代码在 Cursor + Claude Code 里完成,Xcode 只负责最后确认。
这个趋势对 Codex 来说是个好消息,因为它本身就是 CLI-first 的设计,刚好对上了这个新方向。
最讽刺的一件事
Codex App 是 OpenAI 2026 年 2 月发布的 macOS 应用。开发者用它来写 iOS 原生应用。
但 Codex App 自己呢?Electron 做的。
一个教你怎么写原生应用的工具,自己不是原生的。
Reddit 上有个开发者实在受不了了,自己用 Swift 重写了一个 Codex 的 macOS 客户端,发到 r/codex 版块,标题是"I rebuilt the Codex app as a native Swift macOS client"。
这事的荒诞程度,大概就跟一个健身教练自己从不健身差不多。
@ScriptedAlchemy 在 Twitter 上说得更直接:
"Codex 连个 iOS App 都没有,这让我对 AI 实验室'懂开发者'这件事,非常没有信心。"
话糙理不糙。
实际操作建议
说了这么多问题,不代表不能用。相反,现在就是最好的上手时机。
如果你是 iOS 新手:
直接用 Codex 起步。它对新手更友好——不需要你了解太多上下文,它会自己探索。配合 XcodeBuildMCP,从 scaffold 到 build 到 simulator 跑起来,一条龙。$20/月的额度基本够用。
如果你是老 iOS 开发者:
两个都用。Claude Code 做精细的 SwiftUI 工作,Codex 做探索和批量任务。XcodeBuildMCP 是必装的——一个命令就能配好:npx -y xcodebuildmcp@latest mcp。
如果你在带队:
关注 Sentry 的动向。XcodeBuildMCP 现在在 Sentry 手里,而且 Sentry 明确说了要持续投入移动端工具。加上 Xcode 26.3 已经原生支持 Claude 和 Codex agent,苹果自己在推这个方向。
所有人的共同建议:
保持 CLI-first 的工作流。Xcode GUI 只在最后验证阶段用。Thomas Ricouard 的模式值得参考:Cursor/Claude Code 写代码 → XcodeBuildMCP 构建 → Simulator 验证 → Xcode 最后确认。
最后的话
Codex 能写 iOS 应用了,这是事实。
但"能写"和"写得好"之间,隔着 XcodeBuildMCP、SwiftUI 的最佳实践、Liquid Glass 的适配、以及"你怎么确认自己写对了"这个根本问题。
真正让我觉得有意思的,不是 Codex 多强或者 Claude 多好,而是 iOS 开发的工作流本身在变。
以前你打开 Xcode,写代码、编译、调试,全在一个 IDE 里完成。
现在?Xcode 变成了验证工具,写代码在 Cursor 里、调试在终端里、agent 替你跑循环。Thomas Ricouard 说他只有 2% 的时间在 Xcode 里——一年前这种话会被当笑话,现在已经没人笑了。
"完成任务和确认你正确完成了任务,是两件不同的事。"
AI 编程的每一步进化,从 Copilot 到 Cursor 到 Codex,缩短的都是这个距离。
夜雨聆风