先说说我的情况。
我的AI体系背后有一套完整的知识库结构——一个160万字的三脑(知识的储存仓库,所有素材都往里放),和一个60万字的二脑(知识的精炼厂,随时调出高质量内容的地方)。16个技能各管一摊:写文章的、做PPT的、备课的、整理知识库的……每个都是我亲手建的,每个都觉得"这个应该能用"。
然后前几天,我把这16个助手拉出来,做了一次全面体检。
不是那种走过场的检查。我给每一个助手翻了"身份证",看了它们的自我介绍,测试了它们在真实对话中的响应情况。
结果出来之后,我沉默了。
16个助手,20个问题,没有一个是清白的。
注意这个表述——不是"大部分",是"没有一个"。
我一直以为这些助手在帮我干活。检查完才发现:它们不是在帮我,是在骗我。

· · ·
❶ 连身份证都没拿的
有些助手犯的错误,可以追溯到它们被建起来的第一天。
比如有一个叫"公众号发布助手"的,它的"身份证"长这样:
summary: "将output_wx目录下的公众号文章推送到微信公众号草稿箱"
没了。就这两行。没有名字,没有自我介绍。系统不认识它,AI看不到它。
它不是"没用"——它存在,功能设计也没问题。但在真正要用它的时候,它没法自动被调出来。我就经历过这样的情况:昨天写了一篇文章,用的操作步骤今天完全复现不了,又得从头手搓一遍。

另一个更夸张,直接"黑户"——什么身份信息都没填,从正文直接开始。
诊断报告里对它的评价就一句话:"待进一步明确功能边界。"
这大概是一个助手能收到的最惨评价——"你到底干嘛的,我们还没搞清楚。"
· · ·
❷ 用"内部黑话"写自我介绍
有些助手能力其实挺强,但它们的自我介绍用了用户根本不会说的措辞。
比如有个备课助手,自我介绍第一句写的是:
"专为朱老师的AI培训备课服务……输出飞书课件和授课思路稿件。"
来,你告诉我,哪个用户会说"我要输出飞书课件"?
用户说的是:"帮我备课""甲方要个方案""做个培训课件"。
你的自我介绍写的是工具名(飞书课件)和内部称呼(朱老师),让外面的人怎么找到你?
这就像一个社交账号的简介写的是"给张哥做账的小王"——除了张哥本人,没人知道你在说什么。
还有一个大块头助手,体量最大的那个,一共500多行的完整流程设计,自我介绍只有一句话:
"按六步流程,结构化构建专题问答知识库。"
我看了半天:"……这说的什么?"
谁说话会说"结构化构建专题问答知识库"?我只想说"帮我把这个整理一下""归档到知识库""帮我搭个体系"。
就好像你写了一本百科全书,封面却印了一个化学公式。
· · ·
❸ 跟AI自己抢活的
这一类的问题最微妙:如果AI自己就能干这件事,为什么要调你?
有个叫"反馈改稿助手"的,自我介绍写"亲切自然的文本修改助手"。
改文本这种事,AI自己不能干吗?能。那装它干嘛?
后来我仔细看了它的完整设计——它其实有一套很厉害的机制:5到10轮的递进式追问,能帮用户把模糊的改稿意见变成精确的修改方案。这是AI通用能力做不到的。
但它的自我介绍只写了"文本修改助手"四个字。
就像一个米其林大厨,简历上只写了"会做饭"。
另一个助手更典型——叙事节奏助手,自我介绍写"设计内容叙事结构、把握节奏"。说实话,AI自己也能看看节奏吧?但它真正的价值是有一套完整的叙事诊断体系——情绪地图、结构升番技巧、价值观审核矩阵。这些东西AI没有特定指导是不会主动去做的。但自我介绍只写了:"我能看节奏。"
· · ·
❹ 四个助手抢一个活
这是最让我头疼的问题。不是单个助手的毛病,是几个助手放在一起就"打架"。
就说写公众号这件事。我有四个助手跟这个场景相关:
四个助手,一个请求,每个都觉得自己是第一优先级。
你以为我要写一篇文章,AI会自动调出选题→优化提示词→写作→审稿?
现实是——AI看到四个助手都在抢,干脆一个都不调,自己写了。
我精心设计的四步创作流水线,在实际操作中变成了"AI一句话搞定"。
还有更离谱的。有个助手的设计文档里画了一张漂亮的协作图:写文章遇到需要解释的专业概念时,中途调用另一个概念解释助手来帮忙。
设计得很美好。唯一的瑕疵是——从来没发生过。
因为AI已经被第一个助手"占着"了,它不会在同一回合里自己触发第二个助手。这段漂亮的设计,变成了"画饼文学"。
· · ·
❺ 名字就让人记不住的
16个助手里有4个是英文名:feedback-draft-reviser、transcript-processor、wechat-article-analyzer、guizang-ppt-skill(最后一个还是拼音英文混搭)。
有一次我跟AI说:"帮我用反馈改稿那个助手改一下。" AI没反应。我又说:"就是那个……改稿的,叫什么draft的?" AI还是没反应。
用户在对话中只会用中文描述功能("改稿那个""整理逐字稿那个"),而助手的名字是一串英文。AI就算想猜,也未必能精准跨越这个翻译鸿沟。
· · ·
检查完,我发现四堵墙
20个具体问题,归根结底是四种深层病根:
第一堵墙:孤岛效应
16个技能各管各的,不知道彼此存在。一个技能完全不知道其他15个是干嘛的。
第二堵墙:语言鸿沟
我写的描述全是"内部黑话"。我认为它们"很听话",其实它们"听不懂话"。
第三堵墙:流水线幻觉
协作图画得很漂亮,系统层面从来没实现过。想象中的自动化,实际操作中退化成了"手动点菜"。
第四堵墙:没有标准
命名、格式、体量、输出——16个技能16套做法。没有标准,就没有自动化。
· · ·
跟你有什么关系?
你可能会说:"我现在就两三个技能,@谁谁干活,用得好好的啊。"
对。你现在可能两三个,优化一两次就够了,简单直接。
但是——你的知识库在涨。今天存一篇文章,明天放一份资料。我的二脑(精炼厂)已经60万字了,三脑(仓库)160万字了。220万字互相穿插、互相引用,没有一个好用的调度机制,根本处理不过来。

你今天建一个技能,明天觉得"这个场景也可以用一个",后天你又建一个。等你建到第8个、第10个的时候——四堵墙就一堵一堵冒出来了。
提前知道这些坑在哪,比掉进去再爬出来,要轻松得多。
· · ·
不是贩卖焦虑,是治病
写这篇文章不是为了自嘲。发现问题那一刻是有点沮丧的——毕竟每一个助手都花了心思建的。但沮丧完之后反而踏实了:知道问题在哪,就能治。
我已经开始改了。修复注册信息、补全"入口词"、重写自我介绍、划清边界、建立协作协议。
AI助手管理的真正难题,不是"怎么建一个好助手",而是"怎么让一群号称能协作的助手,真的协作起来。"
这16份"检讨书",放在一起,就是这个问题最真实的案例。
· · ·

🎯 送你一份"AI技能体检单"
看完这篇文章,你是不是也想查一查自己的技能体系?
我把我用的"体检提示词"整理好了。
在公众号「海涛AI指南」后台发送 👇
体检
直接复制这段话发给你常用的AI,它就能帮你检查所有技能的问题。
夜雨聆风