系列:JS 的养虾日记 · 第 11 篇
基于结构:P25-KL11
周末要参加一个黑客松。
Agent Evolution Hackthon——主题是 Agent 进化。
需要一张招募海报,还要一个视频首帧。
没有设计师。没有模板。离活动还有几天。
怎么办?让龙虾画。

为什么用龙虾,而不是其它AI呢?
不一样。完全不一样。
今天这篇,就用这次黑客松海报设计的真实过程,拆给你看——用龙虾干活和用 Deepseek 豆包 干活,到底差在哪。
第一个不同:Deepseek 只能建议,龙虾能直接干活
如果我打开 Deepseek,说「帮我做一张黑客松招募海报」。
它能干什么?聊天、建议、搜索。
它会问你要什么风格,帮你写一段提示词,甚至帮你搜几个参考图。
然后呢?没有然后了。
提示词写好了,你自己打开 ComfyUI。参数要自己调。生成要自己跑。图片要自己下载。
Deepseek 只能出主意。剩下全是你的事。
龙虾不一样。
我给龙虾装了一个技能:js-comfyui-skill。装完以后,我说一句话,龙虾自己调用 ComfyUI,自己选工作流,自己填提示词,自己跑生成,自己把图片下载到本地。
9 步出图,4 秒一张。全程我只动了嘴。
Deepseek 是军师——只能出主意,不能动手。
龙虾是员工——能直接干活。

第二个不同:龙虾记得你是谁,豆包不记得
你可能会说:豆包也能画图啊,跟龙虾有什么区别?
区别大了。
打开豆包,说「帮我做一张黑客松招募海报」。它确实能画。
但它会问:什么风格?什么配色?什么品牌?目标受众是谁?
你得从头解释:我的品牌叫 Cyber-Taoist,视觉走赛博朋克漫画风,主色是 JS 黄——色值 #FCD228,线条要硬,不要写实渲染,参考攻壳机动队和阿基拉的画风……
每次都说一遍。关了对话,下次又是陌生人。
豆包能画,但它不认识你。
龙虾不一样。
上一篇讲过,龙虾有六份 bootstrap 文件——AGENTS.md、SOUL.md、USER.md、IDENTITY.md、HEARTBEAT.md、TOOLS.md。这些文件里写着我是谁、我的品牌是什么、我的视觉偏好是什么。
这次我只说了一句:「帮我做一张黑客松招募海报。」
它直接用了 JS 黄 #FCD228,直接用了赛博朋克漫画风,直接知道 Logo 应该放在胸口能量核心的位置。
我没有重新解释任何事情。
不仅如此,它还记得我之前的教训。
有一次生图的时候,我试过黄色皮肤——结果看起来像黄疸。那次教训被记录在工作区的笔记里了。
这次生图,它直接用了自然肤色。没人提醒它,它自己记得。

而且,龙虾的技能是可以配置的。OpenClaw 有一套技能系统——你想让龙虾干什么活,就给它装什么技能。画图、剪视频、操作浏览器、收集知识,能力是可以扩展的。
豆包的能力是固定的,官方给什么你用什么。龙虾的能力是你配的,你需要什么就装什么。
这次做海报,18 张图,纯生成时间加起来大概 72 秒。大部分时间花在我看图、做判断上。
记忆让龙虾知道画什么,技能让龙虾真的能画。但指挥它往哪走的,是你的脑子。
第三个不同:像和员工说话,不是写提示词
这是最大的区别。
用 Deepseek 画图的体验是什么?
写一段很长很精确的提示词。跑一次。不满意?重写整段再来一次。
像填一张表格。填得越精确,结果越好。填错了,整张重来。
用龙虾的体验完全不同。
我是这么跟它说话的——
第 1 次:「画一张赛博朋克风的招募海报。」
龙虾出了初版。角色戴了个大护目镜,遮了半张脸。
我说:「把护目镜去掉,我要看到完整的脸。」
第 3 次:脸露出来了,但皮肤发黄。
我说:「皮肤换成自然肤色。」
第 5 次:好多了。但太严肃了,招募海报需要亲和力。
我说:「表情开朗一点。」
就这么一步一步来。每次只调一个地方。
像和设计师说话一样。

18 次对话里,有三个时刻让我印象很深。
第一个时刻:逐层修改。
面部控制用了三层递进——先去掉遮挡(护目镜),再定肤色,最后调表情。
你不需要一次把所有需求说清楚。一步步来,每一步看一眼结果,再决定下一步改什么。
就像你跟设计师说「先把眼镜摘了我看看」——你不会一开口就写一页需求文档。
第二个时刻:涌现惊喜。
做到第 6 次的时候,我本来只想做一张主视觉。
但在对话过程中,龙虾建议:要不要做几个不同性格的角色版本?用来吸引不同类型的人。
于是就有了四个角色——
元气少女,蓝黑短发,笑容灿烂。吸引活泼型开发者。
冷艳御姐,银黑长发,锐利眼神。吸引沉稳型架构师。
知性科学家,灰黑齐肩发,温和微笑。吸引研究型人才。
叛逆朋克,粉色挑染,不屑表情。吸引黑客型极客。
这四个角色不是我预设的。是对话过程中自然冒出来的。
员工有时候比你想得远。

第三个时刻:人做判断,龙虾做执行。
整个过程里,所有审美决策都是我拍板的:
面部要完整露出,不戴面具——因为招募海报需要亲和力,神秘感反而降低信任 JS Logo 放在胸口能量核心,不放脸上——内敛比外露更有味道 攻壳×阿基拉漫画风,不要写实——视觉冲击力更强 自然肤色,不要黄色——之前踩过坑
龙虾负责的是:4 秒一张,快速实现,让我能看到每个决策的效果。
你负责拍板。龙虾负责出活。
这跟上一篇说的 Harness Engineering 一模一样——你不再亲手画图,而是在设计让龙虾画图的环境和规则。
你是策展人,不是画匠。
总结一下:三层差异
| 执行力 | ||
| 记忆 + 技能 | ||
| 协作方式 |
不是说 Deepseek 和豆包不好。它们各有所长。
但一个只能出主意,一个虽能动手却不认识你。
龙虾是一个记得你、有工具、能干活的员工。
用法完全不同。

龙虾的画笔:js-comfyui-skill 开源了
最后说说那个让龙虾能画画的技能。
js-comfyui-skill——给龙虾装上这个,它就能直接调用 ComfyUI 生成图片和视频。
支持五种工作流:
用起来就一行命令,结果自动下载到本地。不用你手动打开 ComfyUI 界面。
开源地址:github.com/imjszhang/js-comfyui-skill[1]
想让你的龙虾也能画画的,代码在这儿,随便拿。
龙虾的器官越来越多了
回头看这个系列,龙虾的能力一直在长:
记忆(memory-core):让它记住你是谁 眼睛(js-eyes):让它看到登录墙后面的内容 收集袋(js-knowledge-collector):让它自动收集知识 大脑(js-knowledge-prism):让它把散乱信息结构化 画笔(js-comfyui-skill):让它能画图、做视频
五个器官。全部开源。
这不是一只聊天机器人了。这是一只有记忆、有视觉、有知识、有创造力的数字生物。
以上~谢谢你看我的文章,我们,下次再见。
JS 的养虾日记 · 第 11 篇
2026-03-25
引用链接
[1]github.com/imjszhang/js-comfyui-skill: https://github.com/imjszhang/js-comfyui-skill
夜雨聆风