开头
结论先说:我拿同一个写作任务试了 ChatGPT、Claude、Gemini、Kimi 和豆包,最后日常只留了 2 个。
起因是我想找一个能帮我写公众号初稿的 AI 工具。网上的横评全是参数对比和跑分排名,但没人用"写一篇 800 字公众号文章"这种真实任务去试。于是我自己来了一遍——同一个 prompt,同一个主题,5 个工具各写一篇,然后各改一轮。
结果差距比想象中大。不是谁功能多的问题,而是谁写出来的中文像人话。

1. 我为什么要捣鼓它
AI 写作工具太多了,而且每个月都有新的冒出来。2026 年 6 月,光主流的就有 ChatGPT、Claude、Gemini、Kimi、豆包、通义千问、智谱 GLM 等等。
我的需求很简单:帮我写一篇公众号文章的初稿。不是让它帮我写代码、做 PPT 或生成图片,就是写一段 800 字左右的中文,主题是"普通人怎么开始学 AI"。要求是:口语化、有真实感、不要"首先/其次/总之"的八股文结构。
我试过随便挑一个用,但总觉得写出来的东西要么太正式,要么有翻译腔,要么结构一看就是 AI 写的。我想知道到底哪个工具写中文最自然,所以我决定正经试一遍。
2. 我具体怎么操作
测试任务设计。
我给每个工具发了同一个 prompt:你是一个公众号作者,风格轻松、口语化。请写一篇约 800 字的文章,主题是"普通人怎么开始学 AI"。要求:不要八股文结构,有具体例子,语气像跟朋友聊天。写完后我会让你修改。
然后我记录了:首轮产出质量、中文自然度、是否理解指令、修改迭代的配合度、免费额度够不够用。

ChatGPT(GPT-4o)。
首轮产出结构清晰,但语气偏"教科书"。开头是"在人工智能快速发展的今天……",一看就是 AI 标准模板。我让它改口语化,第二轮好了一些,但仍然有"值得注意的是""综上所述"这种正式表达。免费额度有限,多轮对话后容易触发限制。付费 Plus 版 $20/月,Pro 版 $200/月。
Claude(Opus 4.8)。
首轮产出让我比较意外。它没有用"在当今时代"开头,而是直接写"你想学 AI,但不知道从哪开始?很正常,半年前我也不知道。"中文表达自然,语气确实像聊天。修改迭代时理解指令很准,我说"把第二段改短一点,加个具体例子",它只改了第二段,没有动其他地方。免费版每天有一定对话次数,付费 Pro 版 $20/月,Max 版 $100-200/月。
Gemini(2.5 Pro)。
首轮产出质量中规中矩。中文没有明显错误,但偶尔出现翻译腔,比如"这使得学习 AI 变得更加可及"。"可及"这个词在中文日常写作里几乎不会用。修改时理解指令还行,但有时候会把已经改好的部分又改回去。免费版额度相对宽裕,Google AI Studio 支持 1M 上下文。Gemini 最近的强项在多媒体(视频生成达 SOTA),写作不是它最突出的方向。
Kimi(K2.7)。
Kimi 的中文底子不错,首轮产出比 ChatGPT 更口语化,会用"说实话""其实吧"这种表达。但写长文(超过 600 字)时容易跑题,后半段会偏离主题去讲 AI 的发展史。修改迭代时偶尔"忘记"之前的对话上下文。免费版有对话次数限制,API 定价输入 6.5 元/百万 token、输出 27 元/百万 token。

豆包(2.0 Pro)。
豆包速度最快,首轮产出几乎是秒出。但"AI 味"也最重——开头是"随着人工智能技术的飞速发展",结尾是"让我们拥抱 AI,开启智慧生活"。这种表达在 2024 年可能还行,但 2026 年的读者一看就知道是 AI 写的。修改时配合度可以,但不管怎么改,底层那个"AI 公文腔"很难完全去掉。免费版基础功能可用,付费三档:标准版 68 元/月、加强版 200 元/月、专业版 500 元/月。

3. 哪些地方好用
Claude 的中文最像人话。这是最让我意外的。一个美国公司做的工具,写中文反而最自然。它不会出现"在当今时代""综上所述"这类 AI 标配表达,修改指令的理解也很精准。如果你主要写深度长文或需要反复修改迭代,Claude 目前体验最好。
ChatGPT 的综合能力最强。虽然中文写作不如 Claude 自然,但它的多轮对话记忆、联网搜索、图片生成和文件处理是综合最强的。如果你不只是写文章,还需要查资料、生成配图、做数据分析,ChatGPT 是全能型选手。
Kimi 的中文底子好。口语化表达不错,适合写轻松的短文案。价格也比较友好,国内直接用没有网络障碍。
豆包速度快。秒出结果,适合需要快速头脑风暴或列提纲的场景。国内访问稳定。
Gemini 免费额度宽裕。Google AI Studio 免费版给的额度比较大,适合预算有限但想多试几轮的人。

4. 哪些地方不好用
Claude 免费版额度有限。对话次数和消息长度都有限制,深度使用需要付费。而且没有联网搜索功能,写需要最新资料的文章时不方便。
ChatGPT 免费版触发限制频繁。多轮对话后容易弹出"You've reached your limit",Plus 版 $20/月对于只写公众号文章的人来说不算便宜。
Kimi 长文容易跑题。超过 600 字就开始飘,后半段质量明显下降。修改时偶尔丢上下文,需要重复说明之前的要求。
豆包 AI 腔难去。不管怎么改 prompt,产出的底层调性偏"官方",很难写出有个性的文风。另外有一个真实案例:有用户向豆包咨询退票费被误导损失 600 元,AI 回答的可信度需要打个折扣。
Gemini 翻译腔偶尔出现。大部分时候还行,但时不时冒出"这使得""可及""赋能"这种不像日常中文的表达。强项在多媒体而非纯文字。

5. 适合谁,不适合谁
适合 Claude 的人:主要写深度长文、公众号文章、有个人风格的文案,需要反复修改迭代,不介意付费(Pro 版 $20/月)。
适合 ChatGPT 的人:不只是写文章,还需要查资料、生成图片、处理文件等综合任务,习惯英文写作或中英混合内容,愿意付费且用量大。
适合 Kimi 的人:写轻松短文案、朋友圈文案、简短推荐语,需要国内直接使用,预算有限。适合豆包的人:需要快速出结果、列提纲、头脑风暴,写工作汇报等偏正式的文案。
不适合用 AI 写作的场景:需要完全原创、有强烈个人经历的文章——AI 能帮你起草,但灵魂还得你自己加;对事实准确性要求极高的内容——所有工具都可能"一本正经地胡说八道"。
6. 最后结论
如果只能选一个,我选 Claude 做深度写作,ChatGPT 做综合任务。这两个是目前我日常在用的。
Kimi 和豆包不是不好,而是定位不同。Kimi 适合轻松短文案,豆包适合快速出稿和正式文案。Gemini 免费额度宽裕,适合预算有限的入门尝试。
几个实用建议:先用免费版试;prompt 比工具重要;AI 写初稿,你改灵魂;免费的够用就不花钱。
工具在快速迭代,今天的结论可能三个月后就变了。但"拿真实任务去试"这个方法永远有效——别只看参数,自己写一篇试试。
夜雨聆风