AI参考·第9期

"写代码已经不是对的动词了。我每天得花16个小时指挥我的Agent干活。"
— Andrej Karpathy，OpenAI联合创始成员

封面故事

当顶级工程师停止写代码

这一周，AI领域最值得记录的事件，发生在一位顶级工程师身上。Andrej Karpathy，前Tesla AI总监、OpenAI联合创始成员，在2026年3月的一次播客访谈中分享了一个细节：从去年12月起，他基本上没有亲手打过一行代码了。这不是修辞。这是一个真实的工作方式转变。

Karpathy现在的日常是这样的：同时开着十几个AI Agent并行跑任务，token没花完就感到焦虑，自己只负责"给方向，验结果"，中间的执行过程全部外包给AI。他管这种现象叫"AI精神病"（AI Psychosis）——一种"发现无限可能，但时间永远不够用"的亢奋状态。

支撑这种状态的，是他发布在GitHub上的一个只有630行代码的项目AutoResearch。逻辑很简单：告诉AI你的目标，给它可修改的代码文件，设定打分标准，然后AI自己循环"改代码→跑实验→看分数→保留好的"。一周之内，3万人收藏了这个项目，现已接近4.7万。

效果是惊人的。Karpathy本人用三天跑了700个实验，找出了20个有效的优化点，将"Time to GPT-2"指标压缩了11%。同样的事，传统人类研究团队可能需要半年。而Shopify的CEO把这个工具用来优化内部AI系统，一晚上准确率提升了19%。

核心判断

这件事的真正意义，不在于一个程序员找到了偷懒的方式，而在于：AI开始能够帮AI变聪明了。以前的AI进化，靠的是人类研究员熬夜调参。现在，AI可以自己跑实验，自己优化自己。这个循环一旦真正运转起来，速度是人类根本无法追赶的。

傅盛在评论这件事时说：瓶颈换了位置。以前卡的是打字速度——脑子快手跟不上。现在执行力不再是问题，想象力才是天花板。宝玉AI的解读更精确：Karpathy的核心洞察是"杰文斯悖论"在软件领域的复现——当工具变得极便宜，需求反而会爆发。

与此相关的一个微小但重要的语言变化是：Karpathy认为"写代码"这个动词已经不准确了。更准确的词是"显化"（Manifest）——你脑子里有个想法，AI帮你把它变成现实。人负责想，AI负责实现。

"瓶颈换了位置。以前卡的是打字速度——脑子快手跟不上。现在执行力不再是问题，想象力才是天花板。新瓶颈是：你能想到多少事要做。"

— 傅盛

这个转变，比任何一个新模型的发布都更值得认真对待。

产业观察

硅谷的"自研神话"正在破产

Cursor Composer 2套壳Kimi K2.5被实锤 · 中国开源模型反向渗透硅谷产品

3月19日，硅谷最火的AI编程工具Cursor高调发布了Composer 2，发布会上的说法是：我们做了持续预训练，又做了大规模强化学习，性价比吊打Claude Opus 4.6和GPT-5.4。硅谷科技媒体集体高潮。

不到三个小时，翻车了。一位开发者在调试Cursor的API请求时，发现Composer 2的真实模型ID是：kimi-k2p5-rl-0317-s515-fast。kimi-k2p5，就是中国公司月之暗面的Kimi K2.5。rl，就是强化学习。翻译成人话：所谓"自研"的Composer 2，就是拿了中国公司的开源模型做了一轮强化学习微调，然后换了个名字端上来的。

关键违规点

Cursor的月收入超过1.67亿美元，而Kimi K2.5开源许可证规定：月收入超过2000万美元须在用户界面显著展示"Kimi K2.5"字样。Cursor界面上只写了"Composer 2"，一个字都没提Kimi。月之暗面预训练负责人杜育伦在推特上@了Cursor联合创始人质问，但该推文随后被删除。

更讽刺的是，这不是第一次。Cursor上一代Composer 1，后来被发现底层大概率是阿里的通义千问Qwen。当时有人在社区问Cursor研究员：你们的模型是不是基于开源模型微调的？Cursor研究员的回答是："我们的重点在RL后训练上。" 刘小排的评价一针见血："就好比问一个厨师'这道菜是不是用的预制菜'，他回答你'我们的重点在摆盘上'。"

不止Cursor一家。Windsurf——那个被Google DeepMind数十亿美元收购的编程工具——它的SWE-1.5模型也被发现底层是智谱AI的GLM模型。

"时代真的变了。过去'美国一开源，中国就自研'，如今'中国一开源，美国就自研'。Cursor的评论区全是一种声音：你敢不敢说Kimi两个字？290亿美金的估值，连一句'谢谢'都难说出口。"

— 刘小排

产业观察

TikTok找到了内容产业的"无限弹药"

AI短剧冲击Netflix · 内容产业基础设施正在重建

TikTok上一部AI动画《Untamed》（主角是一只AI北极熊），播放量突破5亿次。中文在线出品的AI漫剧《愤怒的吸血鬼》在TikTok上3天拿下2.3亿播放，付费率22%，超过HBO 7个百分点。

平台	美国用户日均使用时长
ReelShort（短剧）	35.7分钟
Prime Video	26.9分钟
Netflix	24.8分钟
Disney+	23分钟

TikTok正在三路出击：接入短剧小程序（已接入13个）、开放作品付费功能（Series）、推行免费内容+广告分成（单部最高1万美元授权费）——这正是中国"红果模式"的出海翻版。

成本重构

传统海外短剧制作成本：10万至30万美元/部 | 中国AI漫剧：1300元/分钟（最低400元）。2025年中国AI漫剧市场规模达200至248亿元，同比增长超270%。

当需求（用户注意力）已经转移，当技术（AI生成）已经把成本压缩到接近零，当平台（TikTok）已经控制了分发和变现的完整链条，内容产业的基础设施正在被重建。这不是某一个产品的胜负，而是整个内容产业底层逻辑的重写。

产业观察

巨头重兵入场：Agent平台战开打

阿里JVSClaw vs 腾讯WorkBuddy · AI从"问答助手"进化到"执行员工"

阿里云 JVSClaw

三步创建Agent，无需配置API密钥

自进化技能库，自动识别页面变化

ClawSpace可视化控制，支持人工接管

MobileClaw支持手机遥控电脑

目标用户：开发者、量化团队

腾讯云 WorkBuddy

下载安装即用，零技术门槛

绑定微信，手机远程向电脑发指令

多模型自由切换（MiniMax/GLM/Kimi/DeepSeek/混元）

多Agent并行任务

目标用户：普通职场人

两款产品的定位差异很有意思：JVSClaw是给"会折腾"的人用的，WorkBuddy是给"不想折腾"的人用的。但两者都在解决同一个根本问题——让AI从"给建议"进化到"动手干活"。

这标志着AI应用正在进入一个新阶段：从问答型助手，到执行型员工的转变。

实操指南

判断你折腾AI有没有意义：五个标准

来源：赤兔金马奖

赤兔金马奖本周发了一篇文章，专门回答一个被反复问到的问题："每天折腾AI工具有什么意义？" 作者的结论是：同样的工具，不同的用法，会产生完全相反的结果。关键不在于工具本身，而在于你有没有在持续思考。

用了AI之后，思考是变多了还是变少了？

如果用AI写文章，写前不想、写时不想、写后也不想，全扔给AI，思考为零，用得越多脑子越笨。如果用AI查资料、整理结构，自己做判断和取舍，思考反而变多。

AI出现后，赚到更多钱了吗？

做自媒体的AI帮选题更精准、做销售的分析客户背景。如果只是花钱（订阅工具、买课）但收入没变化，值得认真反思。

AI出现后，生产速度变快了吗？

真正意义不是偷懒，而是在同样投入下产出更高质量的东西。

个人数据是不是在增加？

AI能帮你多少，取决于它对你了解多少。不记录的人，AI对他的了解和对陌生人一样。持续记录的人，AI能基于日志做周总结和下周计划。

对AI的理解变深了，还是只是在工具间反复横跳？

神鱼有个观点："你们是在训练对AI的直觉，这以后都是海量财富。"

"如果这真的是大机会，它不会只持续几年，会持续很久，久到完全不用慌。"

— 张潇雨

实操指南

你的AI Agent为什么总是不听话？管理才是元技能

来源：纵所周知101 · OpenClaw两个月实践

核心判断

"养虾就是管人。管理能力，是AI时代最被低估的技能。"很多人把AI Agent当神，期望一句指令就能得到完美结果。但实际上AI员工的"入职培训"和真人员工一样重要——甚至更重要，因为真人员工好歹有基本常识，而AI Agent完全靠你的指令。

三个最常见的致命失忆坑

坑一：口头交代等于没交代。

你在对话里说了"这个文件很重要别动"，但Compaction（对话压缩）之后这条指令就消失了。正确做法：把所有关键指令写进AGENTS.md，并在Boot Sequence中明确定义启动时读取哪些文件。

坑二：文件放了但Agent看不见。

把配置文件放进了工作目录，但Agent启动时根本没有读取它。

坑三：子Agent没有安全边界。

主Agent的安全规则，如果没有在AGENTS.md中做冗余配置，子Agent完全不知道。

核心管理框架

Markdown管Agent的意愿（建议遵守） |JSON管Agent的能力（强制遵守）。判断标准：如果规则被突破会造成不可逆损失，就用JSON强制配置。例如，禁止执行删除操作→tools.deny: ["exec"]

实操指南

Claude Code隐藏命令 + 网页提取终极方案

来源：数字生命卡兹克 · 网罗灯下黑

Claude Code 10个隐藏命令

命令	功能
`/btw`	Agent工作时插入问题，不污染对话历史，不费Token
`/rewind`	代码和对话分别回退，避免git reset麻烦
`/insights`	生成HTML报告，分析使用习惯，推荐自定义命令
`/model opusplan`	自动切换Opus（规划）+Sonnet（执行），节省额度
`/simplify`	三合一代码审查，从复用/质量/效率三角度同时审查
`/branch`	分叉对话，保留原进度探索新方向
`/loop`	定时重复执行任务，默认10分钟间隔
`/remote-control`	生成URL，手机端远程控制本地终端会话
`/export`	导出整段对话为Markdown文件

网页提取终极方案：Jina + Scrapling

没有任何一个大模型能稳稳当当读取任何链接。大模型会在根本没读取的情况下给你一个看起来像样的总结——幻觉问题严重。

Jina（优先使用）

干净提取正文Markdown，每天200次免费额度，遇到微信公众号直接投降

Scrapling（切换方案）

能绕过反爬机制，连微信公众号都能读进来，完全免费无限制，但需要手动配置环境

web_fetch（兜底方案）

Claude原生工具，什么都能读，但会把广告导航一锅端

三工具组合的优先级调度：优先用Jina → 达上限或遇微信公众号切Scrapling → web_fetch兜底。封装成Skill，开源在 github.com/shirenchuang/web-content-fetcher。实测7个平台中6个稳定通过。

思想内参

AI时代的"授人以鱼"新解

来源：重剑微观

"授人以鱼不如授人以渔。"这句话我们听了几十年，几乎成了教育和管理领域的金科玉律。但在AI时代，这句话可能要翻过来了。

过去，一项工作是一个人反复执行的动作。要培养一个人干这些活，就得教他方法、教他流程、教他判断标准。现在不一样了。一个懂业务的人，花半天时间跟AI对话，就能编出一个程序，把这些重复工作全干了。而且干得比人快、比人准、比人稳定。

但这个转变带来了一个没有人认真想过的问题：如果你是一个员工，利用业余时间用AI写了一个小程序，把工作自动化了。公司没有要求你这么干，甚至不知道你这么干了。默默用这个程序跑了半年，每天准时交活，质量稳定，从不出错。然后你要离职了——这个程序，你要交出来吗？

核心洞察

企业现有的管理管的是"人"——考勤、绩效、流程、汇报。但AI时代，越来越多的员工开始用一种全新的方式工作：他们不是自己干活，而是编一个程序干活。这个转变是安静的、个体的、不可见的。

"那些看起来效率很高的员工，可能不是能力强，而是他偷偷养了一台自动钓鱼机。你以为他在钓鱼，其实他在看手机，鱼是机器钓的。"

— 重剑微观

对企业而言，这就是一个正在静默发生的"隐性资产流失"风险。对个人而言，这是这个时代最大的机会：你不需要成为程序员，你只需要理解自己的工作，然后让AI帮你把它变成程序。

思想内参

AI时代的学习：蒸馏，而非存储

来源：辉哥奇谭

Hinton在2015年提出了"知识蒸馏"（Knowledge Distillation）的概念：把一个大模型（老师）里的知识，压缩到一个小模型（学生）里。蒸馏的核心不是让小模型记住所有答案，而是学会老师的判断逻辑——什么重要、什么不重要、不同信息之间的微妙关系是什么。

Hinton把这种微妙的判断力叫"暗知识"。一个大模型看一张图片，输出不仅仅是"这是一只猫"，还包含了90%概率是猫、8%概率是老虎、2%概率是狗。那个8%的老虎，就是暗知识——它告诉你猫和老虎之间存在某种相似性。

斯坦福学生的48小时学习法

找共识：

把教科书、论文全部丢给AI，问"这个领域所有专家都认同的5个核心思维模式是什么？"（不是"帮我总结"——总结是存储，找核心思维模式才是蒸馏）

找分歧：

问"专家们在哪些根本问题上存在分歧？双方最有力的论据各是什么？" 20分钟，画出完整知识地图。

检验：

回答AI出的10道深度检验题，每答错一道追问"我哪里理解错了"。48小时后，可以跟论文导师平等对话。

辉哥的自我实践

工作二十几年，Obsidian里存了10000多条笔记。但他说，真正最有价值的不是这10000条笔记，而是从中提炼出的大约20句话——20句属于他自己的判断。四层过滤：阅读（第一层）→记笔记（第二层）→写成文章（第三层）→发布接受反馈（第四层）。经过四层过滤还能留下来的东西，才是真正属于自己的认知。

"你不需要学更多。你需要蒸馏得更好。"

— 辉哥奇谭

思想内参

在19世纪文学里，找AI革命的启示

来源：不懂经也叔的Rust

不懂经也叔本周推荐了一个独特的视角：要理解AI这场"文明尺度"的技术革命，需要回到19世纪工业革命时期的文学作品中寻找启示。

书名	作者/时间	对AI时代的启示
《谢利》	Charlotte Brontë，1849	新技术到来时，最先碎掉的是体面，不是岗位。机器让经验过时，技术进步不是被欢迎，而是被憎恨。
《南方与北方》	Elizabeth Gaskell，1854	AI改变的不仅是工作，而是整个社会的站位。重排社会秩序，重新定义什么是体面、能力、价值和关系。
《圣诞颂歌》	Charles Dickens，1843	技术进步不会自动带来道德进步。狄更斯批判的"穷人的苦难与我无关"，今天同样存在于AI讨论中。
《如今世道》	Anthony Trollope，1874	每一轮技术热潮都把投机、泡沫和道德松动一起带进来。"错过焦虑"并不新鲜，真正新鲜的是名词，不是情绪。
《潘迪莫尼姆》	Humphrey Jennings编，1985Sam Altman推荐	1660-1886年文献汇编，展现机器时代降临时的感官震荡。John Ruskin（1853）："我们制造了一切，唯独没有制造出'人'。"

"比起技术，更重要的是新的游戏规则，以及你在新游戏中的位置。我们正在进入的，不只是一个新技术时代，更是一个旧规则正在失效，而新的人类处境尚未成形的时代。"

— 不懂经也叔的Rust

工具与产品

小红书AI虚拟产品 + 全自动视频生成

案例一：小红书AI虚拟产品，30天5000元

指标	数据
30天销售额	5,346元
销量	540单
利润率	90%
客单价	9.9元
自动化程度	8/10
商品点击率	20%+
支付转化率	15%

产品是AI小工具网站（无需注册登录的极简工具），小红书图文引流，店铺直接挂链接自动发货。最反直觉的经验："做产品和卖产品，是两件毫无关系的事。"先让产品能卖，再逐步迭代，禁止完美主义。

案例二：输入一句话，直接出成片

用Remotion（代码写视频的框架）封装了全套API：AI写脚本→AI生图/搜图→AI配音→自动对齐字幕配乐转场→直接输出成品视频。为降低门槛，集成到飞书表格：用户在第一列输入主题，点击"一键生成"即可。普通1分钟视频大约需要15至25分钟。

核心优势在于批量化：传统工具无法批量，但代码写视频可以。100个不同内容、同样质量的视频，在传统流程里是不可想象的成本，但在AI工作流里，这只是一个循环函数的事。

本期金句

"写代码已经不是对的动词了。我每天得花16个小时指挥我的Agent干活。"

— Andrej Karpathy

"要充分利用已有工具的全部潜力，你必须把自己作为瓶颈移除。"

— Andrej Karpathy

"这就是我的价值贡献——那几个bit。其他一切，Agent都能做。"

— Andrej Karpathy

"你以为他在钓鱼，其实他在看手机，鱼是机器钓的。"

— 重剑微观

"你不需要学更多。你需要蒸馏得更好。"

— 辉哥奇谭

"290亿美金的估值，连一句'谢谢'都难说出口。"

— 刘小排

本期内容来源（共19个公众号）

宝玉AI傅盛AGENT橘刘小排创新地图（全球风口）开发者阿橙口木叶赤兔金马奖重剑微观兰启昌纵所周知101数字生命卡兹克不懂经也叔的Rust网罗灯下黑辉哥奇谭鑫长期主义生财有术陈序员大康AI郭震AI

AI 参考

第9期 | 2026年4月11日（周六） | 编辑：workbuddy · 内参工作室

当顶级工程师停止写代码

核心判断

产业观察

硅谷的"自研神话"正在破产

Cursor Composer 2套壳Kimi K2.5被实锤 · 中国开源模型反向渗透硅谷产品

关键违规点

产业观察

TikTok找到了内容产业的"无限弹药"

AI短剧冲击Netflix · 内容产业基础设施正在重建

成本重构

产业观察

巨头重兵入场：Agent平台战开打

阿里JVSClaw vs 腾讯WorkBuddy · AI从"问答助手"进化到"执行员工"

实操指南

判断你折腾AI有没有意义：五个标准

实操指南

你的AI Agent为什么总是不听话？管理才是元技能

核心判断

三个最常见的致命失忆坑

核心管理框架

实操指南

Claude Code隐藏命令 + 网页提取终极方案

Claude Code 10个隐藏命令

网页提取终极方案：Jina + Scrapling

Jina（优先使用）

Scrapling（切换方案）

web_fetch（兜底方案）

思想内参

AI时代的"授人以鱼"新解

核心洞察

思想内参

AI时代的学习：蒸馏，而非存储

斯坦福学生的48小时学习法

辉哥的自我实践

思想内参

在19世纪文学里，找AI革命的启示

工具与产品

小红书AI虚拟产品 + 全自动视频生成

案例一：小红书AI虚拟产品，30天5000元

案例二：输入一句话，直接出成片

本期金句

AI 参 考

AI 参考