从 Claude 到 GPT 5.5:我的 AI 编程工具迁移实录
结合我这几年在 AI 领域的真实使用经验,聊聊国内外各个模型在生产力层面的优缺点,以及我的选择逻辑,供大家参考。

Claude:全能王者
Claude Opus 系列模型长期以来都是同时期综合能力最强的模型,没有之一。
文本创作:顶级水准。Claude Opus 一直是国内外顶级编剧及文字创作者的首选辅助模型。它的创作内容丰富、文本扎实、AI 味极少。不过最近的 Claude Opus 4.7 在这方面水平下降明显,文字创作还得切回 4.6。
注意我这里说的是辅助创作,一篇人工写完的文章,让它帮忙调整结构,优化措辞,或者帮你续写,效果很惊艳。但直接让它帮你生成文章,可用性很低,至少 40% 的内容需要人工修改。
编程能力:长期霸主。虽然近期被 GPT 5.5 反超,但 Claude 在编程领域的统治力毋庸置疑——前端审美与后端复杂逻辑的处理都是一流水平,我用下来它写的前端有时候甚至比 Gemini 还好。而且它写出的代码本身干净规范,方便维护。
办公辅助:体验惊艳。今年推出的 Claude Cowork 是当前最强的办公辅助产品,集成在 Claude Mac 客户端中,能在电脑上执行各种复杂操作。
我用它做过一份产品 Word 格式的用户手册,涉及大量文案编写和系统截图(包括移动端和 Web 端)。我只提供了需求和简单的系统介绍,它就自动截图、自动生成了两份格式规范、排版美观的手册。虽然大约 20% 的内容仍需调整,但这种完成度已经相当惊艳。
另外,Anthropic 这个月推出的 Claude Design 在设计领域也引起了不小的轰动,这个产品我没体验过,就不做过多评价了。
如果条件允许,Claude 肯定是最优选择。

Claude 的现实困境:账号不稳定,被封的风险高
但现实情况是——条件不允许。
Anthropic 一直以来对账号的安全管控非常严格,国内用户使用很容易封号,最近甚至增加了对 Max 用户的人脸识别验证。价格方面也不友好:20 美金的套餐,高强度编程差不多一个多小时就能把额度耗光。
我先后两个 Claude 账号都被封了,不得不寻找替代方案。

国内模型:各有所长,但都不够”完美”
我最早之前是通过 Cursor 使用 Claude 模型,后面因为 Claude Code 工具的先进性,直接订阅了 Claude 账号。Claude 账号被封后,我没有用回 Cursor,而是继续使用 Claude Code 这个工具,接入了国内模型。
Minimax 2.7:便宜够用的备选。这个模型相当均衡,前端写得一般,对后端复杂逻辑的理解也一般,做 Agent 任务写出的东西只能说勉强能用。但它胜在便宜——29 元/月还量大管饱,还要什么自行车?长期作为我的备用模型。
智谱 GLM 5.0/5.1:能力在线,体验拉胯。 从 5.0 到现在的 5.1,后端编程能力确实能打。但缺陷也很明显:编程速度非常慢,限制 2 个并发,严重影响效率。
价格方面更是劝退——即使订阅了 149 元的 Code Plan 套餐,连续两个多小时高强度编程也能把 5 小时额度用光,同时还会消耗五分之一的周额度。换句话说,每天只能编程两个多小时,一周只能用五天。再加上最近两个月频繁出现服务不可用的情况,价格与 Claude 相当但体验差一大截,性价比不高。
Kimi K2.6:我没用过,但看评论是评分高、实际体验一般的类型。

Codex + GPT 5.5:为什么是它?
在国内模型都不太满意之后,我最终选择了 Codex + GPT 5.5 的组合。
但其实之前我并没有考虑过订阅 GPT 会员,主要原因是 ChatGPT 的文本体验实在太差了。

ChatGPT 的文本”顽疾”
问答体验差。ChatGPT 问答方面确实务实、幻觉低、做研究好用。但作为日常问答助手,体验很糟糕。
首先是回答问题动不动就一句话总结,不管这个问题适不适合。而且同一个回答里会反复出现这句总结,贯穿所有后续内容。比如我问 OpenClaw 与 Hermes 的区别,它的一句话总结就出现了好几次。


其次是疯狂罗列。罗列一大堆信息后,还要在下面补一句”简单来说就是 xxx”。很多时候它会把同一个内容以不同角度讲好几遍,导致简单问题的回答冗长无比,看完完全不想再跟它对话了。
感觉像是 ChatGPT 在后训练时给模型灌输了一个思想:要把用户当傻子。
这也是为什么 Gemini 虽然幻觉问题更严重,我平常大多时候还是更喜欢用 Gemini——因为 Gemini 能好好说话。尤其是配合最近推出的 Spotlight 风格客户端,体验更好。

编程场景更严重。 在 Codex 中,文本问题被进一步放大。编程过程中经常冒出”补丁这个功能”,”这次改动非常稳”,”已对齐 xxx”等奇怪的表达,AI 味十足。好在 GPT 5.5 有所改善,至少那些怪词少了。
此外,Codex 在内置命令方面与 Claude Code 差距不小,比如自动记忆、simplify、insight 等功能都没有,我从 Claude Code 迁移到 Codex 初期挺不适应的,很多功能需要手动创建 skill 来弥补。
前端生成能力一般:ChatGPT 系列通过自然语言生成前端的效果一般,与 Gemini 相比差距明显。
操作电脑功能尚不成熟:Codex 最近推出的操作电脑功能我试了一下,效果一般。我让它在浏览器中搭建一套包含自动写 SQL 和数据库查询的工作流,操作了快二十分钟才完成,中间还弄错了好几次。而且每当它进行屏幕操作或删除错误节点时,都需要用户授权,完全达不到自动化的效果。


但 Codex + GPT 5.5 的核心优势,足够说服我
吐槽归吐槽,编程的核心目标终究是解决问题、完成工作。GPT 5.5 在这方面相当强。
编程完成度极高。这里的”强”不只是评分高(很多模型评分高但实操体验差),而是真正的完成度非常高,速度也很快。GPT 5.5 相比 5.4 速度又有进一步提升。
工具迁移性好。如果从 Claude Code 迁移到 CodeX,迁移非常方便。技能这块直接让 Codex 帮忙建立好技能文件夹的软链接,Codex 就可以直接使用之前为 Claude Code 配置的那些技能。而且如果使用 Codex 打开包含 CLAUD.md 文件的项目,它也能自动识别然后复制这个文件创建一个 CodeX 的专属项目概述文件 AGENT.md,省去了为每个项目重新创建项目概述的麻烦。
图片复刻前端能力出色。虽然自然语言生成前端效果一般,但 GPT 5.5 通过图片复刻前端界面的能力非常强,几乎可以与 Gemini 相当。所以可以先用 ChatGPT 新出的 GPT Image 2 做设计图,再用 GPT 5.5 复刻出界面,照样能实现美观的前端。
性价比不错。20 美金相比国内大部分模型厂商的 Coding Plan 确实更贵(智谱除外),但 ChatGPT 的会员既能用来编程,也能畅享 GPT Image 2 的生图能力,算下来性价比还行。
额度在变得更宽松。我这一周观察下来,Codex 编程的周额度明显增加了。以前每天 5 小时额度用完,周额度会消耗约 20%。但这周开始,每天 5 小时额度用完后,再用约一半甚至更多才会消耗 20% 的周额度。
另外,虽然 GPT 5.5 单位 token 的额度消耗更多,但实测下来它编程速度更快、更智能、消耗的总 token 更少、回复也更简洁实用,综合算下来总配额与之前差别不大。


我的最终方案
单纯订阅 20 美金的 Plus 肯定是不够用的(除非加到 100 美金的 Pro 会员)。
我的方案是:Codex + GPT 5.5 作为主力,搭配 Gemini Plus 会员使用。 Gemini Plus 里的 Gemini 3 Flash 模型用量非常充足,几乎可以视为不限额使用,很适合处理日常轻量级任务。而且 Gemini Plus 里也可以使用 Claude Opus 模型,虽然配额很少,但也算聊胜于无。

写在最后
每个模型都有自己的长板和短板,没有完美的选择,只有最适合自己场景的组合。
另外,看到有文章提到 Claude Code + Xiaomi MiMo-V2.5 是个不错的组合,与 Claude Code 的适配度很高,编程效果也不错。我没试过,有兴趣的朋友可以试试。
希望这篇文章能给正在纠结 AI 编程工具选择的你一点参考。如果你有其他好用的组合,也欢迎在评论区分享。
夜雨聆风