> 五一假期折腾了5天,想模仿guizang-ppt skill做个小红书生图工具,迭代了3个版本,发现最难的不是让AI出图,是自己要想明白图片要长什么样。
一、先交代背景:我在折腾什么
我是个做技术内容的人,平时写公众号、发小红书。五一假期集中折腾了一件事:让AI帮我生成小红书的知识卡片。
不是那种简单的"把文章切成几段配图",是竖版卡片——一张图就是一个知识点,用户滑动浏览,像刷短视频一样刷知识。
这个需求本身不复杂:给AI一篇文章,让它提炼重点,生成810×1080像素的PNG卡片,直接发小红书。
听起来是不是"告诉AI需求,分分钟搞定"的事?
但我迭代了3个版本,才发现坑不在技术,在认知。
二、坑一:我以为"好看"就是标准
第一个版本,我追求的是"高级感"。
杂志风排版,大留白,衬线字体,像纸质刊物一样精致。生成13张卡片,4张是章节过渡页,只有标题没有内容。
但我很快意识到方向错了。
问题出在哪?我后来才想明白:小红书不是杂志,是信息流。
用户在信息流里滑动,平均1-2秒决定要不要继续看。你的卡片如果有一张只有标题、没有信息增量,用户没有背景内容,大概率就是看不懂,直接划走。
杂志风的"留白"在小红书上等于"信息真空",是流失加速器。
这个坑的本质是:把"设计审美"当成了"平台逻辑"。杂志风适合PPT演讲,但是在小红书知识卡片这块就会显得信息密度不够。AI能生成"好看的",但AI不知道"这个平台上的用户怎么消费内容"。
如果你也在用AI做内容,问自己:AI生成的"好看",是不是这个平台上的"好用"?
三、坑二:我以为"工具跑通"就成功了
第二个版本,我换了个工具链,能直接渲染出图。看到命令行输出"Done. 12 cards saved",我觉得成了。
结果是灾难。
生成的卡片像"摘要",不是"观点"。信息密度低,布局匹配失败,读起来像机器翻译的读书笔记。
问题在哪?我跳过了最关键的一步——内容提炼。
工具的工作流其实是两步:第一步,AI把原始文章提炼成结构化内容;第二步,工具把结构化内容渲染成图。我只做了第二步,第一步让AI随便发挥了。
工具再强,也救不了垃圾输入。
这个坑的本质是:把"流程完整性"让AI自由发挥,而没有给场景边界,以现在AI能力大概率搞不定。
如果你也在用AI提效,问自己:你的workflow有几步?有没有哪一步是你默认"AI会处理好"的?
四、坑三:我以为"能看清"就够了
第三个版本,内容质量上去了,但测试反馈说:"看着费劲。"
我第一反应是"标题太大",建议缩小。对方纠正我:是辅助文字太小,不是标题太大。
检查下来,问题一堆:
章节标识12px,几乎看不见 正文24px,拇指滑动时吃力 表格和图表20px,数据对比时模糊 页码13px,辅助信息直接隐形
我犯了设计师的经典错误:在电脑屏幕上看着舒服,不等于在手机上滑动可读。
调整后:
正文24px → 26px 章节标识12px → 14px 表格图表统一22-24px 标题35px不动,反而成了合适的锚点
这个坑的本质是:把"精致感"当成了"可读性"。 字号越小越显得"高级",但用户不会为你的高级感多停留一秒。
如果你也在用AI生成内容,问自己:AI的输出,是在你的电脑屏幕上好看,还是在用户的手机屏幕上好用?
五、坑四(隐藏款):我以为"结构完整"就是"叙事清晰"
13张卡片,我放了4张章节过渡页。起因→误判→根因→解法,结构很完整。
但叙事线越直,章节过渡页越多余。
用户不需要被提醒"现在在讲起因",他们需要被吸引"接下来有什么发现"。章节过渡页是"教学课件"的逻辑,不是"信息流内容"的逻辑。
删掉4张章节头,信息密度提升30%,流失率明显下降。
这个坑的本质是:把"教学结构"当成了"内容节奏"。 内容长,比如课件可以有章节头,但是小红书卡片最多两个知识点,硬放个章节头,会很影响阅读流畅性。
如果你也在用AI做内容,问自己:AI生成的结构,是方便用户理解,还是方便你组织内容?
六、AI很聪明了,但做工具的难点在哪
现在自媒体都在宣传:AI非常智能,需求告诉AI,分分钟就给你搞定。
这话对了一半。
AI确实能生成内容、能写代码、能渲染图片。但AI不知道:
小红书的用户怎么滑动阅读 信息密度和翻页成本的平衡 字号在手机上和电脑上的差异 教学结构和内容节奏的区别
这些不是技术问题,是认知问题。
AI是加速器,能帮你快速实现想法。但AI不是替代器,不能帮你判断"这个想法对不对"。
七、如果你也在用AI提效
三个建议,来自我这几天的学费:
第一,先问平台,再问技术。
你的输出发在哪里?小红书要信息密度,公众号要深度,Twitter要金句。不是"AI生成出来就行",是"这个平台上的用户怎么消费内容"。
第二,工具跑通只是30%。
前置的内容策略、提炼规则、图表选择、字数控制,才是决定质量的70%。AI命令只是最后一步,前面的规则设计才是灵魂。
第三,准备迭代3个版本。
第一个版本验证方向,第二个版本发现规则漏洞,第三个版本才接近可用。第一个版本就完美,是极小概率事件。
八、一个反直觉的结论
AI开发做工具,技术实现只占30%,规则设计占70%。
不是让AI生成内容有多难,是让AI生成"对的内容"难。不是写渲染脚本有多复杂,是定义"什么内容适合什么图表"的判断规则难。
技术实现是体力活,规则设计是脑力活。 而大多数用AI的人(包括我)一开始都把精力花在了体力活上。
更反直觉的是:AI越聪明,做工具的人越需要想清楚"要做什么"。 因为AI能帮你快速实现任何想法,包括错误的想法。
你现在用AI做内容或工具,遇到过"AI生成得很快,但发出去没数据"的情况吗?后来怎么调整的?
或者,你有没有发现某个"常识"在AI时代其实是错的?
夜雨聆风