"写代码已经不是对的动词了。我每天得花16个小时指挥我的Agent干活。" — Andrej Karpathy,OpenAI联合创始成员
封面故事
当顶级工程师停止写代码
Karpathy现在的日常是这样的:同时开着十几个AI Agent并行跑任务,token没花完就感到焦虑,自己只负责"给方向,验结果",中间的执行过程全部外包给AI。他管这种现象叫"AI精神病"(AI Psychosis)——一种"发现无限可能,但时间永远不够用"的亢奋状态。
支撑这种状态的,是他发布在GitHub上的一个只有630行代码的项目AutoResearch。逻辑很简单:告诉AI你的目标,给它可修改的代码文件,设定打分标准,然后AI自己循环"改代码→跑实验→看分数→保留好的"。一周之内,3万人收藏了这个项目,现已接近4.7万。
效果是惊人的。Karpathy本人用三天跑了700个实验,找出了20个有效的优化点,将"Time to GPT-2"指标压缩了11%。同样的事,传统人类研究团队可能需要半年。而Shopify的CEO把这个工具用来优化内部AI系统,一晚上准确率提升了19%。
核心判断
这件事的真正意义,不在于一个程序员找到了偷懒的方式,而在于:AI开始能够帮AI变聪明了。以前的AI进化,靠的是人类研究员熬夜调参。现在,AI可以自己跑实验,自己优化自己。这个循环一旦真正运转起来,速度是人类根本无法追赶的。
傅盛在评论这件事时说:瓶颈换了位置。以前卡的是打字速度——脑子快手跟不上。现在执行力不再是问题,想象力才是天花板。宝玉AI的解读更精确:Karpathy的核心洞察是"杰文斯悖论"在软件领域的复现——当工具变得极便宜,需求反而会爆发。
与此相关的一个微小但重要的语言变化是:Karpathy认为"写代码"这个动词已经不准确了。更准确的词是"显化"(Manifest)——你脑子里有个想法,AI帮你把它变成现实。人负责想,AI负责实现。
这个转变,比任何一个新模型的发布都更值得认真对待。
产业观察
硅谷的"自研神话"正在破产
Cursor Composer 2套壳Kimi K2.5被实锤 · 中国开源模型反向渗透硅谷产品
3月19日,硅谷最火的AI编程工具Cursor高调发布了Composer 2,发布会上的说法是:我们做了持续预训练,又做了大规模强化学习,性价比吊打Claude Opus 4.6和GPT-5.4。硅谷科技媒体集体高潮。
不到三个小时,翻车了。一位开发者在调试Cursor的API请求时,发现Composer 2的真实模型ID是:kimi-k2p5-rl-0317-s515-fast。kimi-k2p5,就是中国公司月之暗面的Kimi K2.5。rl,就是强化学习。翻译成人话:所谓"自研"的Composer 2,就是拿了中国公司的开源模型做了一轮强化学习微调,然后换了个名字端上来的。
关键违规点
Cursor的月收入超过1.67亿美元,而Kimi K2.5开源许可证规定:月收入超过2000万美元须在用户界面显著展示"Kimi K2.5"字样。Cursor界面上只写了"Composer 2",一个字都没提Kimi。月之暗面预训练负责人杜育伦在推特上@了Cursor联合创始人质问,但该推文随后被删除。
更讽刺的是,这不是第一次。Cursor上一代Composer 1,后来被发现底层大概率是阿里的通义千问Qwen。当时有人在社区问Cursor研究员:你们的模型是不是基于开源模型微调的?Cursor研究员的回答是:"我们的重点在RL后训练上。" 刘小排的评价一针见血:"就好比问一个厨师'这道菜是不是用的预制菜',他回答你'我们的重点在摆盘上'。"
不止Cursor一家。Windsurf——那个被Google DeepMind数十亿美元收购的编程工具——它的SWE-1.5模型也被发现底层是智谱AI的GLM模型。
产业观察
TikTok找到了内容产业的"无限弹药"
AI短剧冲击Netflix · 内容产业基础设施正在重建
TikTok上一部AI动画《Untamed》(主角是一只AI北极熊),播放量突破5亿次。中文在线出品的AI漫剧《愤怒的吸血鬼》在TikTok上3天拿下2.3亿播放,付费率22%,超过HBO 7个百分点。
| 35.7分钟 | |
TikTok正在三路出击:接入短剧小程序(已接入13个)、开放作品付费功能(Series)、推行免费内容+广告分成(单部最高1万美元授权费)——这正是中国"红果模式"的出海翻版。
成本重构
传统海外短剧制作成本:10万至30万美元/部 | 中国AI漫剧:1300元/分钟(最低400元)。2025年中国AI漫剧市场规模达200至248亿元,同比增长超270%。
当需求(用户注意力)已经转移,当技术(AI生成)已经把成本压缩到接近零,当平台(TikTok)已经控制了分发和变现的完整链条,内容产业的基础设施正在被重建。这不是某一个产品的胜负,而是整个内容产业底层逻辑的重写。
产业观察
巨头重兵入场:Agent平台战开打
阿里JVSClaw vs 腾讯WorkBuddy · AI从"问答助手"进化到"执行员工"
两款产品的定位差异很有意思:JVSClaw是给"会折腾"的人用的,WorkBuddy是给"不想折腾"的人用的。但两者都在解决同一个根本问题——让AI从"给建议"进化到"动手干活"。
这标志着AI应用正在进入一个新阶段:从问答型助手,到执行型员工的转变。
实操指南
判断你折腾AI有没有意义:五个标准
用了AI之后,思考是变多了还是变少了?
AI出现后,赚到更多钱了吗?
AI出现后,生产速度变快了吗?
个人数据是不是在增加?
对AI的理解变深了,还是只是在工具间反复横跳?
实操指南
你的AI Agent为什么总是不听话?管理才是元技能
核心判断
"养虾就是管人。管理能力,是AI时代最被低估的技能。"很多人把AI Agent当神,期望一句指令就能得到完美结果。但实际上AI员工的"入职培训"和真人员工一样重要——甚至更重要,因为真人员工好歹有基本常识,而AI Agent完全靠你的指令。
三个最常见的致命失忆坑
坑一:口头交代等于没交代。
坑二:文件放了但Agent看不见。
坑三:子Agent没有安全边界。
核心管理框架
Markdown管Agent的意愿(建议遵守) |JSON管Agent的能力(强制遵守)。判断标准:如果规则被突破会造成不可逆损失,就用JSON强制配置。例如,禁止执行删除操作→tools.deny: ["exec"]
实操指南
Claude Code隐藏命令 + 网页提取终极方案
Claude Code 10个隐藏命令
/btw | |
/rewind | |
/insights | |
/model opusplan | |
/simplify | |
/branch | |
/loop | |
/remote-control | |
/export |
网页提取终极方案:Jina + Scrapling
没有任何一个大模型能稳稳当当读取任何链接。大模型会在根本没读取的情况下给你一个看起来像样的总结——幻觉问题严重。
Jina(优先使用)
Scrapling(切换方案)
web_fetch(兜底方案)
三工具组合的优先级调度:优先用Jina → 达上限或遇微信公众号切Scrapling → web_fetch兜底。封装成Skill,开源在 github.com/shirenchuang/web-content-fetcher。实测7个平台中6个稳定通过。
思想内参
AI时代的"授人以鱼"新解
"授人以鱼不如授人以渔。"这句话我们听了几十年,几乎成了教育和管理领域的金科玉律。但在AI时代,这句话可能要翻过来了。
过去,一项工作是一个人反复执行的动作。要培养一个人干这些活,就得教他方法、教他流程、教他判断标准。现在不一样了。一个懂业务的人,花半天时间跟AI对话,就能编出一个程序,把这些重复工作全干了。而且干得比人快、比人准、比人稳定。
但这个转变带来了一个没有人认真想过的问题:如果你是一个员工,利用业余时间用AI写了一个小程序,把工作自动化了。公司没有要求你这么干,甚至不知道你这么干了。默默用这个程序跑了半年,每天准时交活,质量稳定,从不出错。然后你要离职了——这个程序,你要交出来吗?
核心洞察
企业现有的管理管的是"人"——考勤、绩效、流程、汇报。但AI时代,越来越多的员工开始用一种全新的方式工作:他们不是自己干活,而是编一个程序干活。这个转变是安静的、个体的、不可见的。
对企业而言,这就是一个正在静默发生的"隐性资产流失"风险。对个人而言,这是这个时代最大的机会:你不需要成为程序员,你只需要理解自己的工作,然后让AI帮你把它变成程序。
思想内参
AI时代的学习:蒸馏,而非存储
Hinton在2015年提出了"知识蒸馏"(Knowledge Distillation)的概念:把一个大模型(老师)里的知识,压缩到一个小模型(学生)里。蒸馏的核心不是让小模型记住所有答案,而是学会老师的判断逻辑——什么重要、什么不重要、不同信息之间的微妙关系是什么。
Hinton把这种微妙的判断力叫"暗知识"。一个大模型看一张图片,输出不仅仅是"这是一只猫",还包含了90%概率是猫、8%概率是老虎、2%概率是狗。那个8%的老虎,就是暗知识——它告诉你猫和老虎之间存在某种相似性。
斯坦福学生的48小时学习法
找共识:
找分歧:
检验:
辉哥的自我实践
工作二十几年,Obsidian里存了10000多条笔记。但他说,真正最有价值的不是这10000条笔记,而是从中提炼出的大约20句话——20句属于他自己的判断。四层过滤:阅读(第一层)→记笔记(第二层)→写成文章(第三层)→发布接受反馈(第四层)。经过四层过滤还能留下来的东西,才是真正属于自己的认知。
思想内参
在19世纪文学里,找AI革命的启示
不懂经也叔本周推荐了一个独特的视角:要理解AI这场"文明尺度"的技术革命,需要回到19世纪工业革命时期的文学作品中寻找启示。
工具与产品
小红书AI虚拟产品 + 全自动视频生成
案例一:小红书AI虚拟产品,30天5000元
产品是AI小工具网站(无需注册登录的极简工具),小红书图文引流,店铺直接挂链接自动发货。最反直觉的经验:"做产品和卖产品,是两件毫无关系的事。"先让产品能卖,再逐步迭代,禁止完美主义。
案例二:输入一句话,直接出成片
用Remotion(代码写视频的框架)封装了全套API:AI写脚本→AI生图/搜图→AI配音→自动对齐字幕配乐转场→直接输出成品视频。为降低门槛,集成到飞书表格:用户在第一列输入主题,点击"一键生成"即可。普通1分钟视频大约需要15至25分钟。
核心优势在于批量化:传统工具无法批量,但代码写视频可以。100个不同内容、同样质量的视频,在传统流程里是不可想象的成本,但在AI工作流里,这只是一个循环函数的事。
夜雨聆风