我拿同一个任务试了 5 个 AI 写作工具,最后只留了这 2 个

开头

结论先说：我拿同一个写作任务试了 ChatGPT、Claude、Gemini、Kimi 和豆包，最后日常只留了 2 个。

起因是我想找一个能帮我写公众号初稿的 AI 工具。网上的横评全是参数对比和跑分排名，但没人用"写一篇 800 字公众号文章"这种真实任务去试。于是我自己来了一遍——同一个 prompt，同一个主题，5 个工具各写一篇，然后各改一轮。

结果差距比想象中大。不是谁功能多的问题，而是谁写出来的中文像人话。

1. 我为什么要捣鼓它

AI 写作工具太多了，而且每个月都有新的冒出来。2026 年 6 月，光主流的就有 ChatGPT、Claude、Gemini、Kimi、豆包、通义千问、智谱 GLM 等等。

我的需求很简单：帮我写一篇公众号文章的初稿。不是让它帮我写代码、做 PPT 或生成图片，就是写一段 800 字左右的中文，主题是"普通人怎么开始学 AI"。要求是：口语化、有真实感、不要"首先/其次/总之"的八股文结构。

我试过随便挑一个用，但总觉得写出来的东西要么太正式，要么有翻译腔，要么结构一看就是 AI 写的。我想知道到底哪个工具写中文最自然，所以我决定正经试一遍。

2. 我具体怎么操作

测试任务设计。

我给每个工具发了同一个 prompt：你是一个公众号作者，风格轻松、口语化。请写一篇约 800 字的文章，主题是"普通人怎么开始学 AI"。要求：不要八股文结构，有具体例子，语气像跟朋友聊天。写完后我会让你修改。

然后我记录了：首轮产出质量、中文自然度、是否理解指令、修改迭代的配合度、免费额度够不够用。

ChatGPT（GPT-4o）。

首轮产出结构清晰，但语气偏"教科书"。开头是"在人工智能快速发展的今天……"，一看就是 AI 标准模板。我让它改口语化，第二轮好了一些，但仍然有"值得注意的是""综上所述"这种正式表达。免费额度有限，多轮对话后容易触发限制。付费 Plus 版 $20/月，Pro 版 $200/月。

Claude（Opus 4.8）。

首轮产出让我比较意外。它没有用"在当今时代"开头，而是直接写"你想学 AI，但不知道从哪开始？很正常，半年前我也不知道。"中文表达自然，语气确实像聊天。修改迭代时理解指令很准，我说"把第二段改短一点，加个具体例子"，它只改了第二段，没有动其他地方。免费版每天有一定对话次数，付费 Pro 版 $20/月，Max 版 $100-200/月。

Gemini（2.5 Pro）。

首轮产出质量中规中矩。中文没有明显错误，但偶尔出现翻译腔，比如"这使得学习 AI 变得更加可及"。"可及"这个词在中文日常写作里几乎不会用。修改时理解指令还行，但有时候会把已经改好的部分又改回去。免费版额度相对宽裕，Google AI Studio 支持 1M 上下文。Gemini 最近的强项在多媒体（视频生成达 SOTA），写作不是它最突出的方向。

Kimi（K2.7）。

Kimi 的中文底子不错，首轮产出比 ChatGPT 更口语化，会用"说实话""其实吧"这种表达。但写长文（超过 600 字）时容易跑题，后半段会偏离主题去讲 AI 的发展史。修改迭代时偶尔"忘记"之前的对话上下文。免费版有对话次数限制，API 定价输入 6.5 元/百万 token、输出 27 元/百万 token。

豆包（2.0 Pro）。

豆包速度最快，首轮产出几乎是秒出。但"AI 味"也最重——开头是"随着人工智能技术的飞速发展"，结尾是"让我们拥抱 AI，开启智慧生活"。这种表达在 2024 年可能还行，但 2026 年的读者一看就知道是 AI 写的。修改时配合度可以，但不管怎么改，底层那个"AI 公文腔"很难完全去掉。免费版基础功能可用，付费三档：标准版 68 元/月、加强版 200 元/月、专业版 500 元/月。

3. 哪些地方好用

Claude 的中文最像人话。这是最让我意外的。一个美国公司做的工具，写中文反而最自然。它不会出现"在当今时代""综上所述"这类 AI 标配表达，修改指令的理解也很精准。如果你主要写深度长文或需要反复修改迭代，Claude 目前体验最好。

ChatGPT 的综合能力最强。虽然中文写作不如 Claude 自然，但它的多轮对话记忆、联网搜索、图片生成和文件处理是综合最强的。如果你不只是写文章，还需要查资料、生成配图、做数据分析，ChatGPT 是全能型选手。

Kimi 的中文底子好。口语化表达不错，适合写轻松的短文案。价格也比较友好，国内直接用没有网络障碍。

豆包速度快。秒出结果，适合需要快速头脑风暴或列提纲的场景。国内访问稳定。

Gemini 免费额度宽裕。Google AI Studio 免费版给的额度比较大，适合预算有限但想多试几轮的人。

4. 哪些地方不好用

Claude 免费版额度有限。对话次数和消息长度都有限制，深度使用需要付费。而且没有联网搜索功能，写需要最新资料的文章时不方便。

ChatGPT 免费版触发限制频繁。多轮对话后容易弹出"You've reached your limit"，Plus 版 $20/月对于只写公众号文章的人来说不算便宜。

Kimi 长文容易跑题。超过 600 字就开始飘，后半段质量明显下降。修改时偶尔丢上下文，需要重复说明之前的要求。

豆包 AI 腔难去。不管怎么改 prompt，产出的底层调性偏"官方"，很难写出有个性的文风。另外有一个真实案例：有用户向豆包咨询退票费被误导损失 600 元，AI 回答的可信度需要打个折扣。

Gemini 翻译腔偶尔出现。大部分时候还行，但时不时冒出"这使得""可及""赋能"这种不像日常中文的表达。强项在多媒体而非纯文字。

5. 适合谁，不适合谁

适合 Claude 的人：主要写深度长文、公众号文章、有个人风格的文案，需要反复修改迭代，不介意付费（Pro 版 $20/月）。

适合 ChatGPT 的人：不只是写文章，还需要查资料、生成图片、处理文件等综合任务，习惯英文写作或中英混合内容，愿意付费且用量大。

适合 Kimi 的人：写轻松短文案、朋友圈文案、简短推荐语，需要国内直接使用，预算有限。适合豆包的人：需要快速出结果、列提纲、头脑风暴，写工作汇报等偏正式的文案。

不适合用 AI 写作的场景：需要完全原创、有强烈个人经历的文章——AI 能帮你起草，但灵魂还得你自己加；对事实准确性要求极高的内容——所有工具都可能"一本正经地胡说八道"。

6. 最后结论

如果只能选一个，我选 Claude 做深度写作，ChatGPT 做综合任务。这两个是目前我日常在用的。

Kimi 和豆包不是不好，而是定位不同。Kimi 适合轻松短文案，豆包适合快速出稿和正式文案。Gemini 免费额度宽裕，适合预算有限的入门尝试。

几个实用建议：先用免费版试；prompt 比工具重要；AI 写初稿，你改灵魂；免费的够用就不花钱。

工具在快速迭代，今天的结论可能三个月后就变了。但"拿真实任务去试"这个方法永远有效——别只看参数，自己写一篇试试。