
你有没有这种经历——
跟AI说"帮我写个登录功能",它给你整出一堆看不懂的配置代码,改两行就崩。跟AI说"来张炫酷海报",出来的文字歪歪扭扭像小学生涂鸦。跟AI说"帮我做个视频",它给你一段画面抖得像帕金森发作的废片。
问题在哪?不是你运气不好,是你给AI的"指令"压根儿就没写对。
这周三个手艺活,就干一件事——教你怎么跟AI有效沟通。编程、生图、视频,各有一招。
🖥️ 编程篇:写Prompt别再靠感觉了,用"四要素框架"一次过

是什么
AI辅助编程的Prompt四要素框架,简单说就是:角色定位 + 完整上下文 + 结构化输出 + 验收红线,四件套配齐,AI才能一次交出能用的东西。
你平时写编程Prompt是不是这样:
"帮我写一个用户注册接口"
AI给了你一个Express版的,你其实用的是Go Fiber?得,推倒重来。这不叫AI笨,叫你没说清楚。
怎么用
① 角色定位要精确到"人设",别泛泛说"你是专家"
"你是专家"太虚了。换一个:
"你是拥有12年Go后端开发经验的前字节跳动架构师,精通Go Fiber框架和微服务架构"
AI立刻换了一张脸——它调用的推理路径完全不同了。精确的角色描述相当于给AI装上了对应领域的思维模型,比泛泛的"你是专家"效果好一倍以上。
② 完整上下文+硬约束,堵住AI瞎发挥的出口
别光说需求,要把边界也告诉我。技术栈、分层架构、性能SLA、安全红线,一一列出来:
"技术栈:Go Fiber + GORM + PostgreSQL + Redis 架构:六层架构(handler→service→repository→model→dto→middleware) 性能要求:单接口响应<200ms,QPS>1000 安全红线:所有用户输入必须做XSS和SQL注入防护"
AI有了边界,就不敢瞎搞了。
③ 强制结构化输出,用编号锁定顺序
AI写代码有个毛病——喜欢东写一块西写一块。用结构化指令锁死输出顺序:
"请按以下顺序输出:
设计思路(200字以内) 文件清单及职责说明 各层代码(按handler→service→repository顺序) 测试用例"
锁死顺序之后,AI的输出质量稳定得像流水线。
④ 验收标准+死亡红线,防止漏网之鱼
"验收标准:
所有接口返回统一JSON格式 {code, message, data} 缓存穿透必须加布隆过滤器 并发写操作必须用分布式锁"
把"不可妥协"的项写死,AI就没办法偷懒省略。
避坑指南
千万不要一次丢一个巨大需求过去。宁可10个小Prompt,也不要1个大Prompt。每次只让AI做1到2个核心函数,编译通过了再继续下一块。大Prompt等于把宝全压在AI的一次发挥上,翻车的概率比你想象的还大。
🎨 生图篇:GPT Image 2的"先想后做"模式,治好了我的海报焦虑

是什么
GPT Image 2独有一个Thinking推理模式,勾选之后,AI不是"一步到位盲猜",而是先分析需求、规划构图排版配色、再生成。说白了,它学会了"先想后做"。
DALL·E 3是那种——你说"给我一张海报",它啪地一下出来了,好不好全看命。但GPT Image 2的Thinking模式相当于多了一个"策划环节":先想清楚你要什么布局、什么颜色、文字放哪儿,再动手干。复杂海报、信息图的一次出图可用率,比上一代高出不止一个档次。
怎么用
① 先出底图,再局部编辑,别指望一步到位
最佳工作流不是"写一个完美的提示词然后一次出图",而是分两步:
第一步:用Thinking模式生成包含全部文字和主体结构的底图 第二步:用编辑端点做局部微调——换颜色、替换物体、调整元素位置
成功率比一次生成高得多。
② 两种编辑方式灵活切换
Prompt-only编辑:纯文字指令编辑。比如"把背景改成蓝色,保持主体不变"——不用画Mask,一句话搞定 Mask精准区域编辑:圈出要改的区域,写指令只改这一块。适用于"只想改里面这个人的衣服颜色,别的地方不动"
③ 批量产出的"一图多用"策略
一张源图,通过编辑端点换背景、换配色、换文案,能产出一整套电商素材。一个产品图换个背景适配不同平台的风格——小红书、淘宝、抖音各一张,成本几乎为零。
避坑指南
复杂多人场景偶尔还是会出现手部扭曲——这是所有AI生图模型的通病,别太苛求。另外Thinking模式的生成速度偏慢,10-20秒出图,比正常模式慢一倍,但质量值得等。最后,提示词不够具体时构图会偏离预期——别偷懒,把布局描述写到提示词里。
🎬 视频篇:LTX Studio——把"做视频"变成"管项目",一套工具走完全流程

是什么
LTX Studio不是那种"输入一句话吐出一段视频"的简单工具。它是个完整的AI影视生产环境,覆盖从创意、分镜、生成、剪辑到配音的全流程。说人话就是:其他AI视频工具给你"食材",LTX Studio直接给你"全套厨房+菜谱"。
它最牛的地方是Storyboard Generator——你写一个脚本进去,AI自动拆成场景镜头,还能把角色、场景抽成可复用的Elements。这就意味着你不需要每次重新描述主角长什么样了。
怎么用
四步搞定一支AI短片:
① 脚本驱动:上传或编写脚本,AI自动拆分为场景镜头,提取角色和场景为可复用的Elements。这是LTX Studio和其他视频工具最大的区别——它真的在"理解"你的故事,而不是逐句翻译。
② 视觉化:用内置的FLUX.2或Nano Banana Pro生成分镜视觉稿,不满意可以随时改,不用等全部生成完再返工。
③ 视频生成:选择LTX-2.3模型,调Camera Controls(运镜、缩放、角度)——你能精确控制镜头怎么动,不是碰运气。
④ 声音合成:上传音频,AI自动分析情绪节奏,匹配口型和画面。对话场景的唇形同步做得相当可以。
三大性能模式要会用:
积分优化省钱技巧: Retake功能只重拍2到16秒中的任意片段,比重新生成整段节省80%的积分。创意迭代用Speed,局部修改用Retake,最终输出用Quality——按需分配,预算省着花。
避坑指南
LTX Studio需要$35/月起,门槛不低。不是每个项目都值得用——如果是15秒的抖音B-roll素材,用免费工具足够了。只有当你需要"完整叙事逻辑+角色一致性+专业运镜"的时候,才值得上LTX Studio。选工具跟选鞋一样:合脚最重要,不是越贵越好。
这期三个手艺活,有没有发现一个共同点?
无论是写编程Prompt、生图还是做视频,高手和普通人的分水岭都不在工具本身,而在"想清楚了再动手"。
编程篇教你在写代码之前先想清楚角色和约束,生图篇教你在出图之前先想清楚排版和布局,视频篇教你在生成之前先拆好脚本和镜头。三个领域,一个底层逻辑:把"怎么做"的时间让给"想清楚",AI的输出质量会上一个台阶。
下期继续带你解锁AI时代的真本事。手艺活,不搞概念,只教手上功夫。

夜雨聆风