两个月前,我想搞个公众号,用 AI 工具把从找选题到写文章到配图的全流程跑通。
朋友推荐 Codex,说这个最厉害,写代码做内容搭工作流全行。我就开了会员,准备好好折腾一下。
结果一个礼拜过去,它写出来的东西,还不如我自己手敲的。
我不是程序员,也没什么项目要开发。我就想让 AI 帮我运营公众号,听起来要求不高对吧?
但 Codex 有个毛病让我非常崩溃。它会跳过我写好的指令。
我给它写了一套很详细的 Skill,就是操作手册,告诉它第一步干嘛第二步干嘛。它不照着来。
找选题的时候,我让它去查公众号的数据,看什么话题最近有热度。它不去。自己编几个选题给我,看起来很专业,其实根本没人看。

写文章的时候更离谱。我给它一整套写作 Skill,从怎么开头到怎么收尾都写好了,它跳过,自己写。出来的东西一股 AI 味,放到公众号上,读者一眼就能看出来。
生图也是,同样的问题。
我也怀疑过是不是我自己的 Skill 写得有问题,反复调 prompt,把写出来的东西退回去让它改。改完的版本确实好了一点,但好景不长,过一会儿它又开始我行我素。
磨了一个礼拜。
勉强能看了,但我每天都在跟它较劲。
Codex 不行,那就换一个试试。
Claude 的情况不太一样。它的网页版对话框我挺喜欢的,聊天感觉很自然。但我没买会员。
不是因为不好用,是因为怕封号。
社区里经常能看到 Claude 封号的讨论,很多人说用着用着突然就被禁了。虽然我自己没被封过,但花钱买会员然后突然被踢,这种事想想就闹心。索性免费用用,不敢往里投钱。
至于 Claude Code,就是那个命令行版本,我没碰过。
GPT 我主要拿来生图,这块它确实干得不错,至少不会跳过你的指令。
折腾了一圈,Codex 不听话,Claude 不敢用,GPT 只能干生图这一件事。没一个真正适合干文字活的。
也不是说它们不行。写代码、做分析、回答问题,它们都很厉害。但让一个内容创作者拿它们来跑公众号流程,就感觉像是让一个很聪明但完全不听你话的人来给你当助理。
能力是有的,但指挥不动。
后来有朋友给我推荐了 QoderWork。说这个你可能更合适,试试。
说实话我当时已经有点疲了。折腾了一圈工具,没一个顺手的,都有各自的幺蛾子。
但试了一下之后,确实不一样。

最大的差别在哪呢?它会按我写的 Skill 来。不是大概按,是真的每一步都执行。之前 Codex 跳过的那些步骤,QoderWork 都会老老实实走完。
出来的文章质量,比我之前用 Codex 磨了一个礼拜出来的还好。不是好一点点,是那种你读完会觉得「这确实能发」的感觉。
我当时就一个感觉,原来之前的问题不是 AI 不够聪明,是我需要的根本不是聪明。
我需要的是听话。
现在我的搭配是这样的,生图用 GPT,写文章用 QoderWork。各司其职,不指望一个工具包打天下。
说句心里话,回头看那段跟 Codex 较劲的日子,我一直以为是自己的问题,觉得是不是我不会用,是不是 prompt 写得不够好。
后来才明白不是。
有些工具天生就适合干某种活。你需要一个听话的工具帮你按想法把事情做完,还是需要一个聪明的工具帮你想你没想过的事,这是两个完全不同的需求。

现在的 AI 工具都在比谁更聪明,但很少有人认真解决「听话」这个问题。
对于写代码的人来说,工具聪不聪明是第一位的。但对于我这种只想好好写篇文章发个公众号的人来说,听不听话才是。
如果你也在纠结选哪个 AI 工具,不妨先想清楚一件事,你到底需要的是聪明,还是听话。
这两个需求,对应的答案完全不一样。
夜雨聆风