

- 开发质量 = Model + Harness
- 开发成本 = Model + Harness

Cursor 年度会员(均摊约20刀/月) GLM 年度会员(均摊约70块/月,因为我是1月份充了Pro的年度会员) Claude Pro 会员(20刀/月) MiniMax token plan(119元/月)

- DeepSeek V4 Pro
:国内第一梯队,推理能力强,但不支持多模态(看不了图),对于需要截图排查Bug的场景是明显短板。 - 千问 3.7 Max
:能力可以,但不是多模态;3.6 Plus是多模态,但工具调用能力较弱。 - GLM 5.2
:GLM5.1不错,5.2刚刚推出,但订阅接近"抢购"。 - MiniMax M3
:M2.7在后期能力有所下滑,这点不得不防,但M3是多模态,token plan包含TTS等能力,性价比不错。 - Kimi
:价格不透明,所以没用过,但Cursor的Composer是基于Kimi2.5微调的,能力还不错,可以关注。
- GPT 5.5
(通过Codex使用):使用体验非常强,烧token的速度也很快。 - Claude Sonnet 4.6 / Opus 4.8
:能力不错,对"人的意图"理解能力公认领先,但感觉Opus 4.8烧Token的速度是GPT5.5的五倍。
- Cursor
:整体能力很不错,支持GPT 5.5和Claude等主流模型;20刀给到约200刀综合额度,适合大多数人。 - Codex
:目前唯一原生支持自动化测试和验收能力,支持CC Switch接入自定义API;额度消耗比Cursor快,但验收功能节省了大量人工复查时间,性价比我认为很高。 - Claude Code
:自动化场景的首选,headless模式跑定时任务非常稳;但Anthropic的设计比较"刚",用量到0%就停工,要做好任务拆分。现在Claude Desktop也支持CC Switch接入自定义API。

夜雨聆风