乐于分享
好东西不私藏

连春节都没消停的 AI,这个五一我想自己先停一下

连春节都没消停的 AI,这个五一我想自己先停一下

五一第一天,本来打算什么都不干,结果还是顺手刷了下推特。

红杉 GP Stephanie Zhan 和 Andrej Karpathy 上周在「Sequoia AI Ascent 2026」上聊了一场。Stephanie 转发时有句话,讲得挺到位——vibe coding raised the floor, agentic engineering raises the ceiling,也就是 vibe coding 抬高了下限,agentic engineering 抬高了上限。去年 Karpathy 还在讲怎么 vibecoding,今年他说自己作为程序员,从未感到这么落后过。

Karpathy 自己也跟着发了一段挑出了对谈里的三个主题。其中第一个里夹着一句话—— Install .md skills instead of install .sh scripts. 意思是,与其写一个复杂的 bash 安装脚本,不如把步骤写成一段自然语言,丢给 LLM 让它自己读、自己执行、自己根据你的环境调整。

昨晚,我刚好让 AI 帮我写了一个 .md 文件。它叫 chelsea-writing-style,存在 Codex的 skills 文件夹里。做的事情很简单:引用我那份一直在维护的写作风格底稿,以后写文章时,让 AI 自动按我的语气走。

往前倒一点。

去年秋天我有段时间一直想搞清楚 n8n 是怎么回事。跟着教程搭过批量文字生成图片,也搭过用提示词自动生成小红书文案,跑通的瞬间确实有点小满足。但要我从零设计一个新工作流,我就只能告诉 AI:”我想要 xxx,你告诉我每一步该接什么。”中间那段我自己说不清楚。

后来有人问过我一个具体场景:怎么搭一个工作流,把推特上某家竞品公司的推文每天抓到飞书表格做分析?我只能说出第一个节点和最后一个节点,中间一片空白。

工具教程能学会,但把一件事说清楚到 AI 能接住的颗粒度,是另一种能力。我那次没把这个能力练出来,后来也没再硬走 agent 编排那条路。

绕一圈下来,能稳定放进我工作里的协作方式其实很轻。Codex 加几个写给自己的 .md 文件——风格底稿、人物画像、栏目体系——基本能覆盖我大部分内容工作。没什么复杂的 agent 编排,就是把那些反复要用的判断和偏好写下来,让 AI 每次都能直接读到。对非技术背景的人来说,稳得住的 AI 协作可能不在 agent 编排里,在那些愿意写下来的 .md 文件里。

Karpathy 用一句很顺口的话,给我已经在做的事起了个名字。

五一假期才刚开始。这两年 AI 这边新模型、新 agent、新产品出得太密,连推特和新闻都不用刷——朋友圈每天都有人转、有人点评,连春节那几天都没停过。

与其接下来这几天又去追一个新工具,不如盘一下自己手头那些反复在做的小动作,看看哪些可以写成一段话、丢进一个 .md 文件里,让 AI 下一次直接接住。

也祝大家有一个不被 AI 追着跑的五一假期。


附:Karpathy 这条笔记的中文整理

对那场对谈本身感兴趣的话,下面是 Karpathy 自己发的笔记里三条线的简短中文转述(按意思整理,不是逐字翻译)。

一、LLM 不只是加速已有的事,更在打开新的形态

他举了三个例子:

1.menugen——一个完全可以被 LLM 包住的应用:输入一张图、输出一张图,中间所有事 LLM 自己原生就能做,不需要传统代码。

2.install .md skills instead of install .sh scripts——与其写一段复杂的 bash 安装脚本,不如把步骤用自然语言写出来,告诉用户”把这个交给你的 LLM 看就行”。LLM 是英文的高级解释器,能根据你的环境智能调整、就地 debug。

3.LLM 知识库——过去用经典代码根本做不到的东西,因为它要对来自任意来源、任意格式的非结构化知识做计算。

他强调,每次范式转变,最容易看见的都是”加速旧东西”,但更值得关注的是这种”突然变得没必要再存在的事,或原本根本做不到的事”。

二、LLM 能力的不均匀

同一个模型,可能既能流畅重构十万行代码,又会让你”走到洗车店去洗车”。他过去把这种不均匀归因于”领域可不可被验证”(verifiability),这次又加了一层经济解释:前沿实验室在 RL 训练时把哪些数据塞进训练分布,是被收入和市场规模决定的。

如果你的问题正好落在它训练数据分布里,等于在 RL 轨道上飞;如果不在,就像在丛林里拿着砍刀自己开路。他自己对这个解释还不完全满意,不过要想用上 LLM 的强项、又绕开它的坑,建立一个准确的 LLM 能力地图本来就是件需要持续推进的事。

三、Agent 原生经济

把产品和服务拆解成传感器(sensor)、执行器(actuator)和逻辑(logic),分散在 1.0 / 2.0 / 3.0 三种计算范式里(即传统代码、神经网络、LLM 三层);如何让信息对 LLM 最大限度可读;agentic engineering 这套正在浮现的技能集和相应的招聘方式;甚至更远一点的设想——绝大部分计算最终由神经网络完成,传统 CPU 退到协处理器的位置。