
▲ AI像个全科实习生:什么都能干,什么都干不明白
我最近发现一个特别有意思的现象。
朋友圈里装Hermes的、跑Claude Code的、折腾各种Agent框架的,越来越多。见面第一句话不是"吃了吗",而是"你那Agent跑起来了没"。
跑起来了。都能跑。然后呢?
让AI写个网页——它写出来一个能跑但巨丑的东西。让AI改文案——它把你写的"特别好"改成"非常特别好"。让AI写个小工具——UI界面像Windows 95穿越回来的。让AI审方案——"这个方案很有创意,你觉得呢?"
我朋友老张说了一句很精辟的话:现在的AI像个全科实习生。什么科都能轮一遍,什么科都干不明白。
就在这时候,我在头条上看到一篇文章。标题很诱人——
"89k高星项目:给你的AI装进近150个专家角色"。
89k星,接近9万,和LangChain一个量级。GitHub上一个叫agency-agents的项目,据说是147个AI专家角色打包。技术圈的朋友疯狂转发。
我花了一下午研究,发现问题了。

▲ 89k Stars项目「注水」拆解:宣称的 vs 实际的
星标数字严重存疑。一个接近90k星的项目,我没在任何AI榜单上见过,作者在社区近乎无名。它说的安装方法——"把markdown文件扔进~/.claude/agents/目录"——那个目录根本不存在。整篇文章12个大章节,每章4到6个小点,大量举例填充,核心信息被稀释得几乎找不到。标准的AI批量流量文。
我有点生气。不是气文章骗人——流量文嘛,常态了。我气的是我自己:我明明知道这大概率是假的,还是忍不住想试试。
做了三十年纪录片导演,我见过几百个剧组和生产线。一个剧组里,摄影只管摄影,灯光只管灯光,导演只管讲故事。谁要敢说"我一个人全包了",所有人都会笑他。
但到了AI这里,所有工具都在教育你:一个模型就够了,一个对话窗口就能搞定一切。
这不对。三十年的经验告诉我,专业化分工才是生产力。不是AI不行,是分工没到位。
大概一个月前,我开始试着搭一套自己的协作系统。没什么宏大蓝图,就是觉得:如果四个模型各自干各自擅长的事,会不会比我对着一个窗口反复调教强?
我没用什么号称几十k星的开源项目,就从Hermes Agent的Skills系统入手,写角色、定流程、建记忆。我给这套尝试起了个名字叫"四智囊"——四个AI助手角色,各干各的,协作干活。
第一个叫管仲,是协调者。不写代码不写文案,只做三件事:拆任务、分配、验收。
第二个叫智源,是研究员。我给它定了12道题的追问框架,任何课题进来都要走完。一个月下来,攒了十几篇分析。
第三个叫文心,是写作者。它有固定的叙事结构和风格约束。
第四个叫巧匠,是工程师。先读需求文档,再出技术方案,最后写代码。
谁都觉得最难的是写Prompt。其实不是。最难的是让它们记住东西。
人类合作之所以高效,是因为长期记忆。AI默认是"每次都是新朋友"。我在每个角色的记忆模块上花的时间,比写Prompt多得多。就这一个改动,效果从"能用"变成了"好用"。
但我得说实话——这套东西远没到"搭好了"的程度。还在试,还在改,经常翻车。
那个89k星的项目,核心问题其实有三个:
第一,它夸大了数字,骗你点进来。
第二,它的方法跑不通,骗你花时间去折腾。
但第三点才是最隐蔽的——它让你以为「搭好AI系统」这件事,是一个可以下载的东西。
就像你不会去下载一个"我学会了弹钢琴.exe",然后双击就能弹肖邦。AI协作系统是你自己工作流的映射。你的管线长什么样,你的角色分工怎么设计,你的记忆系统怎么架构——这些东西只有你自己知道。
那些号称90k星的项目、一键安装的解决方案、复制粘贴就能用的角色包——凡是告诉你"下载就能用"的,大概率不靠谱。
真正好用的东西,是你自己一手一脚试出来的。

▲ 捷径不存在
你可以从我这里拿走四智囊的架构思路、岗位分工、交接协议、记忆模块的埋法。这些我都可以给你。但你得自己去搭。
这不是鸡汤。这是我做了三十年片子最深的一个体会:捷径不存在。不是你不够聪明找不到捷径,而是从A到B的路,每一段都只能自己走。有人给你指路已经算你运气好了。
星标不是生产力。下载不是解决方案。一套能记住你的偏好、能按流程干活、能交接给下一个角色的AI系统,才是。
这篇文章写完了。我得回去接着调管线了。
管天,纪录片导演,AI权力游戏「管仲看AI」主理人。30年没放下摄像机,最近开始学着让AI干活——效果嘛,有时候像个全科实习生,有时候还行。
— 全文完 —
夜雨聆风