AI很聪明了,但为什么做个工具还是这么难?

> 五一假期折腾了5天，想模仿guizang-ppt skill做个小红书生图工具，迭代了3个版本，发现最难的不是让AI出图，是自己要想明白图片要长什么样。

一、先交代背景：我在折腾什么

我是个做技术内容的人，平时写公众号、发小红书。五一假期集中折腾了一件事：让AI帮我生成小红书的知识卡片。

不是那种简单的"把文章切成几段配图"，是竖版卡片——一张图就是一个知识点，用户滑动浏览，像刷短视频一样刷知识。

这个需求本身不复杂：给AI一篇文章，让它提炼重点，生成810×1080像素的PNG卡片，直接发小红书。

听起来是不是"告诉AI需求，分分钟搞定"的事？

但我迭代了3个版本，才发现坑不在技术，在认知。

二、坑一：我以为"好看"就是标准

第一个版本，我追求的是"高级感"。

杂志风排版，大留白，衬线字体，像纸质刊物一样精致。生成13张卡片，4张是章节过渡页，只有标题没有内容。

但我很快意识到方向错了。

问题出在哪？我后来才想明白：小红书不是杂志，是信息流。

用户在信息流里滑动，平均1-2秒决定要不要继续看。你的卡片如果有一张只有标题、没有信息增量，用户没有背景内容，大概率就是看不懂，直接划走。

杂志风的"留白"在小红书上等于"信息真空"，是流失加速器。

这个坑的本质是：把"设计审美"当成了"平台逻辑"。杂志风适合PPT演讲，但是在小红书知识卡片这块就会显得信息密度不够。AI能生成"好看的"，但AI不知道"这个平台上的用户怎么消费内容"。

如果你也在用AI做内容，问自己：AI生成的"好看"，是不是这个平台上的"好用"？

三、坑二：我以为"工具跑通"就成功了

第二个版本，我换了个工具链，能直接渲染出图。看到命令行输出"Done. 12 cards saved"，我觉得成了。

结果是灾难。

生成的卡片像"摘要"，不是"观点"。信息密度低，布局匹配失败，读起来像机器翻译的读书笔记。

问题在哪？我跳过了最关键的一步——内容提炼。

工具的工作流其实是两步：第一步，AI把原始文章提炼成结构化内容；第二步，工具把结构化内容渲染成图。我只做了第二步，第一步让AI随便发挥了。

工具再强，也救不了垃圾输入。

这个坑的本质是：把"流程完整性"让AI自由发挥，而没有给场景边界，以现在AI能力大概率搞不定。

如果你也在用AI提效，问自己：你的workflow有几步？有没有哪一步是你默认"AI会处理好"的？

四、坑三：我以为"能看清"就够了

第三个版本，内容质量上去了，但测试反馈说："看着费劲。"

我第一反应是"标题太大"，建议缩小。对方纠正我：是辅助文字太小，不是标题太大。

检查下来，问题一堆：

章节标识12px，几乎看不见
正文24px，拇指滑动时吃力
表格和图表20px，数据对比时模糊
页码13px，辅助信息直接隐形

我犯了设计师的经典错误：在电脑屏幕上看着舒服，不等于在手机上滑动可读。

调整后：

正文24px → 26px
章节标识12px → 14px
表格图表统一22-24px
标题35px不动，反而成了合适的锚点

这个坑的本质是：把"精致感"当成了"可读性"。 字号越小越显得"高级"，但用户不会为你的高级感多停留一秒。

如果你也在用AI生成内容，问自己：AI的输出，是在你的电脑屏幕上好看，还是在用户的手机屏幕上好用？

五、坑四（隐藏款）：我以为"结构完整"就是"叙事清晰"

13张卡片，我放了4张章节过渡页。起因→误判→根因→解法，结构很完整。

但叙事线越直，章节过渡页越多余。

用户不需要被提醒"现在在讲起因"，他们需要被吸引"接下来有什么发现"。章节过渡页是"教学课件"的逻辑，不是"信息流内容"的逻辑。

删掉4张章节头，信息密度提升30%，流失率明显下降。

这个坑的本质是：把"教学结构"当成了"内容节奏"。 内容长，比如课件可以有章节头，但是小红书卡片最多两个知识点，硬放个章节头，会很影响阅读流畅性。

如果你也在用AI做内容，问自己：AI生成的结构，是方便用户理解，还是方便你组织内容？

六、AI很聪明了，但做工具的难点在哪

现在自媒体都在宣传：AI非常智能，需求告诉AI，分分钟就给你搞定。

这话对了一半。

AI确实能生成内容、能写代码、能渲染图片。但AI不知道：

小红书的用户怎么滑动阅读
信息密度和翻页成本的平衡
字号在手机上和电脑上的差异
教学结构和内容节奏的区别

这些不是技术问题，是认知问题。

AI是加速器，能帮你快速实现想法。但AI不是替代器，不能帮你判断"这个想法对不对"。

七、如果你也在用AI提效

三个建议，来自我这几天的学费：

第一，先问平台，再问技术。

你的输出发在哪里？小红书要信息密度，公众号要深度，Twitter要金句。不是"AI生成出来就行"，是"这个平台上的用户怎么消费内容"。

第二，工具跑通只是30%。

前置的内容策略、提炼规则、图表选择、字数控制，才是决定质量的70%。AI命令只是最后一步，前面的规则设计才是灵魂。

第三，准备迭代3个版本。

第一个版本验证方向，第二个版本发现规则漏洞，第三个版本才接近可用。第一个版本就完美，是极小概率事件。

八、一个反直觉的结论

AI开发做工具，技术实现只占30%，规则设计占70%。

不是让AI生成内容有多难，是让AI生成"对的内容"难。不是写渲染脚本有多复杂，是定义"什么内容适合什么图表"的判断规则难。

技术实现是体力活，规则设计是脑力活。 而大多数用AI的人（包括我）一开始都把精力花在了体力活上。

更反直觉的是：AI越聪明，做工具的人越需要想清楚"要做什么"。 因为AI能帮你快速实现任何想法，包括错误的想法。

你现在用AI做内容或工具，遇到过"AI生成得很快，但发出去没数据"的情况吗？后来怎么调整的？

或者，你有没有发现某个"常识"在AI时代其实是错的？