摘要
65% 的代码初稿由 AI 生成。这不是未来,是 Anthropic 现在的日常。
Anthropic 产品团队 65% 的代码初稿,由 Claude Tag 生成——按代码行数统计,覆盖从需求分析到实现的全流程。这些代码仍需经过人类审查、测试和修订才能合并入库。同样的模式正从工程蔓延到其他部门:产品指标追踪、客户支持工单、复杂 bug 的根因定位。员工们开始习惯性地 @Claude 来处理这些事。
⚡ 核心发现
答案不是"模型更强了"——Claude Tag 跑的是与 Claude Code 相同的底层模型。**真正的差别在于工作方式。** 这 4 条经验没有一行代码,但每条都能让你的团队少走半年弯路。
🗣️ 说人话:Anthropic 已经不在"用 AI"了——他们在"和 AI 共事"。差别在哪?往下看。

为什么"私聊 AI"是个问题
过去两年,AI 协作的主流姿势你肯定不陌生:一个人、一个对话窗口、一个 AI。你在 Claude Code 里写代码,在 ChatGPT 里聊需求。个人效率没问题,但放进一个十人、百人的真实团队,致命缺陷就暴露了:AI 没有团队记忆。
每个人都要从头解释相同的背景。AI 不知道你同事在做什么,每次对话都是新的会话,之前的背景、决策理由、失败教训全部归零——你得像第一次见面一样,把所有上下文重新喂一遍。
Claude Tag 的产品形态很简单:把 Claude 以团队成员身份加入 Slack 频道,持续"旁听"对话,积累项目背景。任何人 @Claude,它就能基于已有上下文理解任务、拆解步骤、调用工具,在线程里返回结果——但背后需要解决上下文窗口管理、权限最小化控制、长线程语义压缩等复杂的工程问题。
但 Anthropic 很快发现:技术只是入场券,真正难的是一整套工作方式的改变。 以下 4 条经验,每条都是踩坑踩出来的。
🗣️ 说人话:你团队里每个人的 AI 都像金鱼——七秒记忆。不是 AI 的错,是你的团队信息没喂给它。
经验一:对 AI 来说,没写下来 = 不存在
AI 同事的"信息食谱"只有一个来源:公开的、可搜索的文本。 Slack 消息、代码仓库、文档、会议纪要——这些它能消费。但私下的走廊交谈、私信、受限文档,对 AI 来说等于不存在。不是权限不够,是物理限制:AI 没有耳朵,不会在茶水间听到八卦。
Anthropic 的做法很干脆:不逐个纠结"这个文档要不要给 AI 看",而是划定几个清晰的安全边界——比如整个 Slack 工作区、文档库、会议纪要——边界内默认公开,人和 AI 共享同一份信息流。
三个直观的好处:
敏感信息怎么办?私信 @Claude、用 Claude.ai 或 Claude Cowork——这些渠道是私密的,不会被共享 AI 消费。

你能马上做的事:检查你的团队——AI 现在能看到多少工作上下文?只有你私聊窗口里那点东西?第一步:新建一个项目公开频道,把讨论、文档、决策全部放进去,让 AI 加入。
🗣️ 说人话:想让 AI 变聪明,先让它"看见"足够多的东西。藏着掖着的团队,AI 永远是个局外人。
经验二:人机团队需要一张"花名册"
人类团队有花名册、岗位说明书、职责划分。人机团队也需要——而且更需要。角色模糊的后果不是"有人多干了有人少干了",而是更糟的:每个人私下跑自己的 AI 集群,工作重复,团队上下文被割裂。
Anthropic 的工程团队做了一件听起来有点好笑但极其有效的事——给团队创建了一份包含 AI 成员的"花名册"。不同的 AI 承担不同角色:一个负责数据分析(连着 BigQuery),一个维护设计标准,一个做研究综合。项目启动时,人和 AI 一起讨论谁做什么。项目变复杂了?直接加新的 AI 角色——比如他们后来加了一个"发布管理智能体"。
他们还给每个 AI 编写了"技能文件"来定义专长,这样公司里其他人也能快速复制相同类型的 AI。角色清晰之后,人在同一个线程里和 AI 协作,任何人随时能看到进度、接续别人的工作。
反面教材也很现实:当指标定义本就不统一、数据源各自不同时,每个人私下跑自己的 AI 查询会让问题更隐蔽——AI 会给每套不一致的数据配上"看起来很权威"的解释,制造出多套自洽但互相矛盾的结果。共享 AI 的价值在于:一旦团队先解决了指标定义的统一,共享 AI 就能让所有人都看到同一份答案,也更容易发现数据治理的根因问题。
你能马上做的事:写一份团队"人机花名册",列出每个成员(人类 + AI)的名字和职责。然后问自己一个扎心的问题——你的团队 AI 有"岗位说明书"吗?
🗣️ 说人话:别让你的团队变成"每个人偷偷养一个 AI 宠物"。把 AI 当成真正的同事,给它一个明确的职位——该负责什么、不能碰什么,白纸黑字写清楚。
经验三:AI 不只是"你让它干啥它干啥"
大部分人跟 AI 的相处模式:给任务 → 执行 → 结束。这是"响应式 AI"。Anthropic 发现,如果把一个清晰的目标写入 AI 的系统指令,配合定期的自动化扫描机制,它就能在生成输出时提出你没想到的相关建议。
他们管这叫"北极星目标"。真实案例:内部工具团队在 AI 的 prompt 中植入了"让产品上手流程更有帮助"这个目标,并配置了定期扫描脚本。结果 AI 在生成文案时,自动对比了目标,输出了修改上手流程中错误信息的建议。改完之后那一周,上手成功率显著提升。
关键要理解:这不是 AI 产生了"主观能动性"——它是在目标约束下,基于模式匹配在输出中更倾向生成与目标对齐的内容。就像一个搜索引擎在 query 里加了过滤条件后,返回结果会更精准。但"持续努力的方向"确实是有了,区别在于这个方向是人类预设的。
两个关键约束:第一,北极星目标只能由人类设定,要扎根于公司的使命和业务目标——AI 不能自己给自己定方向。第二,不是每个 AI 都适合主动建议——人类要选择哪些 AI 有"提案权"。
还有一个意外收获:有了北极星目标后,人类会议反而能聚焦在最重要的工作上。因为 AI 已经在后台消化了大量"应该有人管但一直没人管"的零碎事务。
你能马上做的事:给你的 AI 同事写一句北极星目标。不是"帮团队提效"这种废话——要具体。"让新员工第一天就能独立提交代码",或者"把客户反馈到产品迭代的时间从两周缩到三天"。写完贴到团队公开频道,让 AI 也能读到。
🗣️ 说人话:你对 AI 说"帮帮忙",它的输出是随机的。你在 prompt 里写"我们要让用户上手时间缩短一半",它的输出就会往这个方向靠——不是因为它有主观能动性,是因为目标约束改变了它的输出分布。
经验四:配置 AI 就像配置自动化脚本——先沙盒测试,再逐步扩大触发范围
别指望 AI 第一天就能独当一面。Anthropic 的工程师已经让 AI 独立处理了 500 个 bug 修复——但刚开始时,他们对 AI 的每一个决策都做人工审查。需要明确:与培养新人不同,标准 API 调用是无状态的,AI 不会因为"用多了"而自动变强——它的每次进步都来自人类优化 prompt、更新知识库、调整验证规则。
信任是有意识、分阶段建立的。Anthropic 总结了一套四步法:
第一步,手动审查。 AI 的每一项工作过人手,同时设计验证清单——什么样的工作算合格?
第二步,引入"执行者-验证者"模式。 一个 AI 执行,另一个 AI 检查。代码跑测试,技术文档过量规和风格指南——辅以规则引擎和静态分析工具做异构验证。人类设定质量标准,用多种手段交叉检查,能有效降低随机错误率。但需要留意:同一底层模型的不同实例可能共享类似的盲区,在关键任务上引入异构工具验证会更可靠。
第三步,把反思纳入工作循环。 每周让 AI 生成一份结构化的"经验教训与失误"日志,由人类审查后手动更新系统 prompt 或知识库——作为外部记忆补偿。需要明确:标准 API 调用是无状态的,模型权重不会因为"总结"而自动更新,真正的"避免再犯"靠的是人把教训写进下次的指令里。
第四步,按任务类型逐步授权。 跟踪每个 AI 在哪些任务上已证明可靠,多次成功后按类型扩大。不是"这个 AI 靠谱所以什么都让它干",而是"代码格式检查靠谱,可以放手;架构设计还需要审查"。
一个特别生动的案例:一位工程负责人接手了积压严重的新团队。一组 AI 通读所有积压项、评分复杂度,另一组 AI 筛出中低复杂度项、生成代码变更。起初人类审核每一个决策。后来他们配置了路由规则:当变更涉及跨系统依赖或影响面超过阈值时,自动触发上报流程——这靠的是预定义的触发条件,而非 AI 对"艰难"的主观判断。再后来,他们在 prompt 中加入了"人类的注意力是稀缺资源"这一约束——AI 开始将问题集中打包、一次提交、附带关键上下文。随着任务边界被明确限定在已验证可靠的范围、prompt 模板逐步固化,负责人花在重复性指导上的时间大幅减少,AI 在特定标准化任务中的表现越来越稳定。
你能马上做的事:从最低风险的任务开始——文档整理、数据汇总、代码格式检查。先手动审查 10 次,没问题就建验证规则让 AI 自己跑,你只抽查。每周花 10 分钟看 AI 的"失误总结"。信任不是给的,是 AI 用一次又一次的正确交付挣来的。
🗣️ 说人话:别一上来就把核心业务交给 AI。像配置自动化脚本一样——先在沙盒跑通,再开放部分权限,确认稳定后再扩大范围。AI 不会自己"成长",每一次变强都是你改了 prompt 或更新了知识库。
你不是在"用 AI",你是在"和 AI 共事"
回头看这 4 条经验,它们有一个共同的底色:不新鲜。 明确的北极星目标、清晰的职责划分、公开透明的信息环境、逐步建立的信任——任何一本管理学教科书都会告诉你这些。AI 没有发明新的团队规则,它只是让"不跳过这些基本功"的代价变得更高。
用 Anthropic 的原话收尾:"那些从 AI 身上获益最多的团队,恰恰是最刻意落实这些基本法则的团队。"
你现在就能做的第一件事,不是买什么工具、装什么插件。而是做一个简单的思维转换:把你的 AI 当成一个真正的同事,而不是一个藏在私聊窗口里的工具。
💡 5 个自查问题(来自 Anthropic 内部实践)
1. 你的 AI 能看到团队的所有必要信息吗?还是只活在你的私聊窗口里? 2. 你能写出团队的完整花名册(含 AI)并说清每个人负责什么吗? 3. 每个成员——包括 AI——都配备了完成工作所需的工具吗? 4. 你们有验证 AI 工作质量的标准吗?还是全靠"感觉做得不错"? 5. 你的团队有一个清晰到能写下来的北极星目标吗?
能答上三题,你的团队在信息透明和角色定义上已经建立了扎实的基础——在当前大多数团队还在探索怎么"用"AI 的阶段,这已经是实打实的先发优势。
数据来源:Anthropic 官方博客 "Introducing Claude Tag"、Anthropic 教育团队 "Building human-Agent teams" by Kristen Swanson
夜雨聆风