当你的AI像个傻子

—— 一个89k星AI项目的骗局，和一个导演的试错实录

▲ AI像个全科实习生：什么都能干，什么都干不明白

我最近发现一个特别有意思的现象。

朋友圈里装Hermes的、跑Claude Code的、折腾各种Agent框架的，越来越多。见面第一句话不是"吃了吗"，而是"你那Agent跑起来了没"。

跑起来了。都能跑。然后呢？

让AI写个网页——它写出来一个能跑但巨丑的东西。让AI改文案——它把你写的"特别好"改成"非常特别好"。让AI写个小工具——UI界面像Windows 95穿越回来的。让AI审方案——"这个方案很有创意，你觉得呢？"

我朋友老张说了一句很精辟的话：现在的AI像个全科实习生。什么科都能轮一遍，什么科都干不明白。

就在这时候，我在头条上看到一篇文章。标题很诱人——

"89k高星项目：给你的AI装进近150个专家角色"。

89k星，接近9万，和LangChain一个量级。GitHub上一个叫agency-agents的项目，据说是147个AI专家角色打包。技术圈的朋友疯狂转发。

我花了一下午研究，发现问题了。

▲ 89k Stars项目「注水」拆解：宣称的 vs 实际的

星标数字严重存疑。一个接近90k星的项目，我没在任何AI榜单上见过，作者在社区近乎无名。它说的安装方法——"把markdown文件扔进~/.claude/agents/目录"——那个目录根本不存在。整篇文章12个大章节，每章4到6个小点，大量举例填充，核心信息被稀释得几乎找不到。标准的AI批量流量文。

我有点生气。不是气文章骗人——流量文嘛，常态了。我气的是我自己：我明明知道这大概率是假的，还是忍不住想试试。

做了三十年纪录片导演，我见过几百个剧组和生产线。一个剧组里，摄影只管摄影，灯光只管灯光，导演只管讲故事。谁要敢说"我一个人全包了"，所有人都会笑他。

但到了AI这里，所有工具都在教育你：一个模型就够了，一个对话窗口就能搞定一切。

这不对。三十年的经验告诉我，专业化分工才是生产力。不是AI不行，是分工没到位。

大概一个月前，我开始试着搭一套自己的协作系统。没什么宏大蓝图，就是觉得：如果四个模型各自干各自擅长的事，会不会比我对着一个窗口反复调教强？

我没用什么号称几十k星的开源项目，就从Hermes Agent的Skills系统入手，写角色、定流程、建记忆。我给这套尝试起了个名字叫"四智囊"——四个AI助手角色，各干各的，协作干活。

第一个叫管仲，是协调者。不写代码不写文案，只做三件事：拆任务、分配、验收。

第二个叫智源，是研究员。我给它定了12道题的追问框架，任何课题进来都要走完。一个月下来，攒了十几篇分析。

第三个叫文心，是写作者。它有固定的叙事结构和风格约束。

第四个叫巧匠，是工程师。先读需求文档，再出技术方案，最后写代码。

谁都觉得最难的是写Prompt。其实不是。最难的是让它们记住东西。

人类合作之所以高效，是因为长期记忆。AI默认是"每次都是新朋友"。我在每个角色的记忆模块上花的时间，比写Prompt多得多。就这一个改动，效果从"能用"变成了"好用"。

但我得说实话——这套东西远没到"搭好了"的程度。还在试，还在改，经常翻车。

那个89k星的项目，核心问题其实有三个：

第一，它夸大了数字，骗你点进来。

第二，它的方法跑不通，骗你花时间去折腾。

但第三点才是最隐蔽的——它让你以为「搭好AI系统」这件事，是一个可以下载的东西。

就像你不会去下载一个"我学会了弹钢琴.exe"，然后双击就能弹肖邦。AI协作系统是你自己工作流的映射。你的管线长什么样，你的角色分工怎么设计，你的记忆系统怎么架构——这些东西只有你自己知道。

那些号称90k星的项目、一键安装的解决方案、复制粘贴就能用的角色包——凡是告诉你"下载就能用"的，大概率不靠谱。

真正好用的东西，是你自己一手一脚试出来的。

▲ 捷径不存在

你可以从我这里拿走四智囊的架构思路、岗位分工、交接协议、记忆模块的埋法。这些我都可以给你。但你得自己去搭。

这不是鸡汤。这是我做了三十年片子最深的一个体会：捷径不存在。不是你不够聪明找不到捷径，而是从A到B的路，每一段都只能自己走。有人给你指路已经算你运气好了。

星标不是生产力。下载不是解决方案。一套能记住你的偏好、能按流程干活、能交接给下一个角色的AI系统，才是。

这篇文章写完了。我得回去接着调管线了。

管天，纪录片导演，AI权力游戏「管仲看AI」主理人。30年没放下摄像机，最近开始学着让AI干活——效果嘛，有时候像个全科实习生，有时候还行。

— 全文完 —