乐于分享
好东西不私藏

AI Sandwich:AI会越来越会干活,而你要学会往两头走,而不是和抢活干

AI Sandwich:AI会越来越会干活,而你要学会往两头走,而不是和抢活干

四月底,Every的AI & I播客出了一期访谈。Dan Shipper和Cora的GM Kieran Klaassen聊了一个话题:AI现在已经能写代码、写文案、做方案、出设计,如果中间那段执行层基本被解决了,人到底该站在哪?

Kieran给了一个比喻,很简单,简单到像在开玩笑。但这个比喻我越想越觉得,它可能比市面上大多数AI工作流框架都更接近真相。

他说:把AI工作流想象成一个三明治。AI是中间那块肉,人是两片面包。

没讲完。后面还有一句更重要的:大多数人过去二十年训练出来的工作方式,是把自己当肉。现在肉被AI当了,你还往中间挤,只会被夹扁。

这篇文章我想把AI Sandwich讲透——它到底是什么意思,为什么它对普通人来说可能比学会用任何具体AI工具都重要,以及你怎么把它用到自己的日常工作里。

01

过去二十年,我们一直把自己当肉

先说一个你可能没意识到的事实。

在我们学会用AI之前,所有关于“工作能力”的定义,都默认你站在流程的中间。

写一篇文章?你要自己查资料、列提纲、写初稿、改句子、调结构。做一份方案?你要自己整理信息、判断需求、画PPT、反复修改。写代码?你要自己拆需求、写逻辑、debug、重构。

中间那段执行层,就是你过去这么多年练出来的核心能力。 你的效率、你的专业度、你的不可替代性,全都建立在这上面。

然后AI来了。它写初稿比你快,整理资料比你全,写代码比你稳。所有你最擅长的事,它忽然做得比你好或者至少和你一样好。你慌不慌?

大多数人的第一反应是:那我就更努力地学AI,让它的执行能力发挥到极致。我要把prompt写得更长,把workflow搭得更复杂,让AI多做一点、再多做一点。

Kieran管这个叫“死胡同”。他的原话是:“LLMs are very good at just following steps, doing deep work, working for hours—days even now. That thing is kind of solved.”——模型非常擅长一步步跟指令、做深度工作、连续工作几小时甚至几天。执行这件事,某种意义上是已经被解决了。

如果你还在跟AI比谁能把执行层做得更好,你是在跟一个不知疲倦、没有拖延症、不用睡觉的东西比耐力。你没有赢的可能。

但Kieran接下来问了一个特别狠的问题:如果执行层被解决,工作流里还有什么东西是AI搞不定的?

答案就在三明治的两片面包上。

02

两片面包:开头定框架,结尾做判断

AI Sandwich的核心逻辑只有一句话:AI跑中间,人管两头。

先讲第一片面包——开头:定框架。

Dan Shipper在访谈里说了一句我很服气的话:“agents can’t change frames.”Agent不会切换看问题的角度。

他举了个例子。如果你膝盖疼,你可以吃止痛药,可以拉伸髂胫束,可以停止在硬路面上跑步。同一个症状,人类可以从完全不同角度来诊断问题根源。而给Agent一个任务,它做的第一件事是问:“往哪个方向查?”它需要一个站位才能启动,在查的过程里很难主动问:“我们要不要换一种思路?”

很多人在用AI的时候,以为开头的活儿就是写prompt。不对。开头最关键的不是写一大段咒语,而是定框架。Kieran把它拆成了四件事:

第一,问题到底是什么。

不是“帮我写一篇文章”,而是“帮我写一篇给小老板看的文章,让他明白为什么AI落地不能只买工具,还要改工作交接方式”。

第二,谁来读、谁来用。

同一个主题,给老板看、给销售看、给运营看,写法完全不一样。AI不知道你的读者是谁,除非你告诉它。而“知道该告诉它什么”这件事,只有你懂。

第三,什么算好。

是要讲清楚概念,还是要让对方做出某个具体动作?目标不同,整个产出的方向就不同。

第四,边界在哪。

能不能用竞品做对比?能不能用某个特定案例?预算上限是多少?这些边界条件决定了AI产出能不能用。

Kieran管这个阶段叫planning。在他的compound engineering框架里,这是四步中的第一步。他说的原话是:如果计划足够清楚,work这一段已经可以交给模型很大一部分。

再说第二片面包——结尾:做判断。

AI把活干完之后,你要做的不是检查错别字,而是问自己一个问题:这个结果,对吗?它真的能交出去吗?

人类可以同时识别出同一个问题的多种可行解决方案,而AI不擅长这件事。它能给你一个像样的答案,但不一定是最合适的。

Kieran举了一个音乐上的例子。他以前是古典作曲出身,他说音乐表演里有一个环节叫polish。不是改谱子,是反复听、反复感受、反复微调,直到那个东西“对了”。他管这个过程叫“taste”——品味。

放到AI工作流里,taste就是结尾那片面包里最核心的活儿。AI做完事之后,你能不能判断:这个结果符不符合你最开始的设想?如果不对,是哪里不对?要重新定什么框架再让AI跑一遍?

我听一个做AI辅导老师的朋友说过一句很精辟的话:“AI能证明自己是对的,但证明不了自己是错的——除非你指出来。很多人AI用不好,是因为他指不出来。”

开头那片面包考验的是你定义问题的能力。结尾那片面包考验的是你做判断的能力。而这两件事,恰恰是AI目前最不擅长的。

Dan Shipper在访谈的X推文里总结得非常精炼:“This is what separates art, which has a point of view, from generic slop.” 做判断这件事,是把有立场有态度的作品,和流水线出来的AI slop分开的那条线。

03

把三明治做成可以滚雪球的循环

Kieran不光提了AI Sandwich,连配套的工程框架也讲了。叫Compound Engineering。四个步骤:Plan、Work、Review、Compound。

前三个你已经懂了。Work是AI跑的那段(肉),Plan和Review是人要做的(两片面包)。

第四个步骤,Compound,是Kieran这套框架里我最想单独讲的东西。

什么叫Compound?翻译成大白话:每跑完一轮,让AI把你这次学到的经验沉淀下来,方便下次复用。

他自己举的例子是这样的。做完plan→work→review,你会得到两样东西:一个成功的产出,和一大堆运行日志、prompt记录、review意见、修改过程。如果你把这些东西扔了,下次你从零开始。如果你把每轮里的框架设计经验和review决策喂给AI,跟它说“这是上一轮任务里我认为值得记住的部分”,下一次你再定义问题时,AI已经装着上一轮的经验了。

很像复利的逻辑。而且不需要特别的工具。他提到可以用GitHub issue来记,用Notion来记,或者直接在IDE里用注释做。关键在于你要让这个记录的循环被AI读到,而不是躺在你的脑子里。

我自己在跑自己的知识库的时候,最吃亏的就是这一步。跑了上百次分析,每次都是新鲜开局。三个月后想复盘一个结论是怎么做出来的,已经找不到当时的上下文了。如果我有意识地把每轮的分析框架和review意见喂回去,第二十次分析的质量应该远高于第一次。

三明治只告诉你人在哪。Compound告诉你,人还应该把每次都变厚一点。

04

AI Sandwich的边界在哪

讲完这个概念,我必须踩一脚刹车。

AI Sandwich不是万能的,它有一个明确的适用边界。而这个边界,就是信任。

Every的David Koss在4月28号发了一篇对AI Sandwich的回应。他引入了一个很重要的概念叫Trust Battery——信任电池。这个概念是Shopify CEO Tobi Lütke最早提出的,意思很简单:所有合作关系都运行在信任电池上。信任电池有电,你可以给它更多空间;信任电池没电,你得亲自盯紧每一个环节。

把Trust Battery和AI Sandwich放在一起,你会看到一个更完整的画面:

你和AI之间的信任电池够不够电,直接决定了两片面包可以夹多远。

David Koss自己举了四个场景:

第一件事——一个管理员脚本。他看了一眼AI写的代码,发现没什么问题,就直接部署了。为什么?因为信任电池满的。这种脚本他写了上百次,AI也写了上百次,他知道AI能搞定。

第二件事——一个日志收集分析系统。他还是用了AI Sandwich,但这次花了二十分钟检查,发现了三个连接错误和架构问题才部署。信任电池半满。

第三件事——一个内部应用用于管理公司业务流程。他花了额外的时间先跑数据验证脚本,确定数据映射正确、权限安全、工作流逻辑没问题,才上线。信任电池只够三分之一。

第四件事——一个涉及金融数据的任务。他直接退回了传统开发模式,手动写代码、手动测试、手动review。不是AI不能用,是后果他承受不起。

这四件事用的是一模一样的AI Sandwich工作流——人定框架、人做判断。但信任电池的充电状态不一样,人的参与深度就完全不一样。

AI Sandwich不是一个“放之四海而皆准”的公式。它的执行半径,取决于你和AI之间已经建立多少信任。 信任高,两片面包可以夹很远。信任低,你不仅要检查结果,还得钻进流程中间抽查AI的执行过程。

我在实际的公众号文章写作里也碰到类似的情况。有些选题我写了二十篇以上,AI Sandwich跑得非常流畅:我定选题和框架,AI出草稿和素材整理,我改结构、加故事、调语气。但每次遇到一个全新的领域,我发现自己会不自觉地挤回中间——我会在AI出草稿之前先自己写一段,去感受“这个题到底应该怎么写”。这不是流程的问题,是我和AI之间在这个领域还没有建立足够的信任。等我在这个领域写够五篇,AI Sandwich又回来了。

信任电池是你的参与度的调节枢纽。 很多人刚开始接触AI Sandwich会有一个困惑:开头该多细?结尾该查多深?答案不在流程设计里,在信任电池上。信任不够的时候,你就多做一点,多钻进中间看几眼。信任够了,你自然会放手更多。

05

普通人怎么把这套东西用到自己身上

讲完了理论,说点你能现在就开始做的事。

第一,把你明天要做的一件事,拆成三明治。

找一件你明天真正要干的活——写周报、做方案、改代码,什么都行。然后在动手之前,先花15分钟定框架:这件事到底要解决什么问题?给谁看的?什么算好?边界在哪?把这四个问题的答案写下来,然后丢给AI让它跑中间那段执行。最后花10分钟做判断:结果能不能用?哪里不对?要不要重新定框架再跑一轮?

你第一次跑这个流程,可能觉得“定框架”比“亲自做”还费劲。正常。因为你定框架的能力还没练出来。练上十次,你会开始发现:你花在改AI产出上的时间在变短,因为你开头定的框架越来越准。

Kieran的原话是:“The more you trust the model, the further apart those two slices of bread get.”你越信任模型,两片面包就离得越远。

第二,把你的信任电池画出来。

拿张纸列三个清单:

  • 清单A:哪些任务你闭着眼睛都知道AI能做好?对这些,面包可以夹很远。

  • 清单B:哪些任务AI能做但你不能完全放心?对这些,Review要仔细,必要时钻回中间抽查。

  • 清单C:哪些任务你不敢冒任何风险?对这些,别用AI Sandwich。自己上。

这份清单不是固定的。它应该每月更新一次。六个月后回头看,A清单应该越来越长。

第三,让你和AI的每一轮合作都留下痕迹。

David在文章里说他已经跑通了这一步。他用任务间文件作为trust电池的缓存——上一轮任务的执行记录和Review意见,会直接写进下一轮AI的上下文里。AI不需要重复学习,它直接继承上次的经验。如果你已经装过Notion MCP或相关工具,AI可以直接在任务间创建一个memory文件,自动写入值得保留的关键事项。

最简陋的版本:建一个记事本,每次跑完一轮AI Sandwich,记一行“这次定框架踩了什么坑”和“review环节发现什么问题”。下个月你翻这个笔记,会长出一张你自己的AI协作能力地图。

06

写在最后

回到文章开头那个问题。AI越会干活,你该站在哪?

我读了很多关于“AI时代人类价值”的文章,大部分都在说两件事:要么让你学更多的AI技能,要么告诉你“AI替代不了人类的创造力、情感、共情”。前者让你永远追在AI后面跑,后者太虚了,没人告诉你明天上班到底该怎么做。

AI Sandwich的意义在于:它给了普通人一个可操作的位置——站在开头和结尾。

开头是你的框架,是你在行业里泡了这么多年积累下来的嗅觉——知道什么问题是真正重要的问题,知道这个客户真正在乎的是什么。

结尾是你的判断力,是你看了几百个案例之后培养出来的taste——知道这个东西能不能交付,有没有真正解决问题。

这两件事,AI目前做不了。不是因为AI不够强,而是因为这两件事的本质都是在“做选择”,而选择需要承担后果。AI不承担后果。只有你承担。

Kieran在访谈里说过一句很朴实的话:“Find your place in an AI-accelerated world by leaning into what brings you joy.”在一个被AI加速的世界里,找到你位置的方式不是拼命追AI,而是回到那些让你觉得有劲儿的事上。

对于普通人来说,AI Sandwich最大的价值不是让你更高效——是让你知道,你不需要跟AI比谁能干更多活。你只需要站在它够不着的地方,做它做不了的事。

你手里那两个位置,是AI Sandwich的答案,也可能是AI时代普通人最后的一张底牌。