| 名称 | 输出单价 (元/百万Token) | 单Token产出价值星级 | 核心价值特点 & 适用场景 |
| 1 | Claude Opus 4.6/4.7 | 180 | ★★★★★ 顶级 | 逻辑严谨、专业精度拉满,法律/金融/学术/深度分析,单Token含金量最高 |
| 2 | GPT-5(旗舰) | 216 | ★★★★☆ 极高 | 指令遵循、工具调用、复杂推理顶尖,输出规整可用度强,通用高端场景首选 |
| 3 | Gemini 3.1 Pro | 86 | ★★★★ 很高 | 长上下文、科学推理、多模态突出,行文精炼、冗余少 |
| 4 | 豆包 Seed 2.0 Pro | 16 | ★★★★ 很高 | 中文场景第一,表达地道自然,文案、对话、本土业务产出价值突出 |
| 5 | 通义千问 Qwen3.7-Max | 60 | ★★★★ 高 | 中文逻辑扎实,长文档梳理、结构化报告表现优异 |
| 6 | DeepSeek V3.2/V4 | 3~8 | ★★★☆ 中高 | 数学、代码、推理能力强,文字表达偏简洁生硬,文采偏弱 |
| 7 | Claude Sonnet 4.6 | 108 | ★★★☆ 中高 | 长文本处理优秀,综合能力均衡,单Token价值弱于旗舰Opus |
| 8 | Kimi K2.5 | 21 | ★★★ 中等 | 长文本理解见长,生成内容偏冗余,单位有效信息占比一般 |
| 9 | GPT-4o-mini / GPT-5 Nano | 4~18 | ★★ 偏低 | 响应快、成本低,内容深度、细节不足,仅适合简单基础任务 |
| 10 | 通义千问 Flash / 轻量开源模型 | 0.2~2 | ★ 低 | 极致低价,信息密度低、易冗余、质量波动大,仅适配短句问答、简单交互 |