ROT:AI时代每一分钱都要算清楚

管理学大师彼得·德鲁克有一句话，被引用了无数次：

"你无法管理你不能量化的东西。"

这句话在AI时代遇到了一个奇特的困境：每家公司都在用AI，AI账单在快速增长，但当你问任何一位管理者"你们公司AI投入的回报是多少"，十之八九给不出一个清晰的数字。

这不是懒惰，是方法论的缺失。

我们用了几十年的ROI（投资回报率），放到AI投入上，正在失去解释力。这篇文章想聊一个替代性的指标框架——ROT（Return on Tokens，Token回报率）——以及它背后更重要的一件事：在AI时代，对"效率"的理解需要从根本上更新。

ROI为什么在AI时代失效

ROI的公式是：收益 / 投入 = 回报率。

问题出在"投入"的定义上。ROI诞生于工业时代和金融时代，当时"投入"的主要形态是：资本（采购设备、购置场地）、人力（雇人做事）、时间（项目周期）。这三者都有成熟的会计处理方式，可以被清晰地数字化。

但当你用AI处理1万份简历、每天自动生成50份市场报告、或者让AI智能体代替人工处理客户投诉，你的核心成本是什么？

不是硬件——你不需要自己买GPU；不是人力——AI在做，不是人在做；不是时间——AI处理速度极快。

你的核心成本，是Token。

Token是AI的基本计算单位。你输入的每个字符，AI输出的每段内容，都以Token计费。不同模型的单价差异可以有几十倍，不同的使用方式消耗的Token量可以差几百倍。当AI成本的主体是Token，而不是资本或人力，传统ROI框架就失去了捕捉能力——它的成本端和价值端都对不上。

更深层的问题是：AI的价值很难被财务报表即时呈现。

一家公司用AI把报告生产速度提升了5倍，这5倍速度在哪条财务科目上？没有。节省的人工时间，如果没有裁员，只是"让那些人去做别的事"，也没有直接体现为成本节约。ROI算不了，不是因为AI没带来价值，而是因为它带来的价值是生产力密度的提升，而不是传统意义上的"收入增加"或"成本减少"。

这就是我们需要一个新指标的根本原因。

什么是ROT

ROT的定义，我尽量说得直接：

ROT（Return on Tokens）= 产出价值 / Token成本

每消耗一定数量的Token，带来多少可量化的价值。

举三个真实场景的计算：

场景一：内容生产某市场团队，每月用AI生成行业报告和营销文案，总Token成本约200元。同样的工作，如果由两名编辑人工完成，需要两周，成本约2万元。ROT = 20000 / 200 = 100。

场景二：客服自动化一个客服机器人，每月处理10000个咨询，Token成本800元。三名人工客服处理同等工作量，月成本约1.5万元。ROT = 15000 / 800 ≈ 19。

场景三：代码审查工程团队用AI做代码审查，每月Token成本500元。人工审查同量代码，高级工程师需约20小时，成本约4000元。ROT = 4000 / 500 = 8。

你注意到了什么？不同场景的ROT相差十几倍。内容生产的ROT是代码审查的12倍多——不是因为AI写文章比审代码厉害，而是因为不同任务的人工替代成本差异极大。

这是ROT框架最直接的价值：让你看到资源错配。

当你发现你每月Token开销的大头，用在了ROT只有3-5的场景上，而有ROT高达100的场景只占很小一部分——这个发现的价值，比"我们在AI上花了多少钱"这个数字有意义得多。

同一个模型，ROT能差20倍

这是我在实际观察中发现的最令人震惊的现象。

两支团队，使用同一个模型，在同类业务场景下工作，ROT相差将近20倍。不是因为模型能力差距，不是因为业务难度不同，而仅仅是工作方式的不同。

高ROT团队的做法：

系统提示词经过精心设计，每次只包含任务必需的信息，清晰结构化，没有废话

对话上下文定期压缩，用摘要替代原始历史，把每次请求的Token量控制在合理范围内

任务分级，简单的分类和格式化用最便宜的模型，只有真正需要深度推理的任务才用顶级模型

建立了可复用的提示词模板库，常见任务不再每次从零开始

低ROT团队的做法：

没有系统提示词，每次对话都在框里重新解释背景

对话上下文越来越长，越来越贵，但有效信息密度在稀释

所有任务都用最贵的模型，理由是"反正效果最好"

每次从零开始，什么都没有沉淀下来

结果：高ROT团队用了低ROT团队约1/5的费用，产出了3-4倍的有效工作量。

这不是能力的差距，这是工程化程度的差距。

把这个现象往更深处想，它其实在说一件事：AI时代，技术本身不再是护城河，使用技术的方法论才是。OpenAI的模型所有人都能调，贵贱区别在怎么用。就像同样一把好刀，厨师和普通人用起来结果完全不同——刀的质量分高下，用刀的技艺分高下，但后者的差异往往更大。

ROT的三个层级

ROT不只是一个任务层面的指标。它有三个层级，从个人到企业到生态，每一层的管理逻辑不同。

个人ROT：你作为个人用户，每天消耗的Token，带来了多少效率提升？

这一层最容易被忽视，也最容易被优化。高个人ROT的人，通常具备以下特征：他们用AI处理的是高频、高价值的任务，而不是可有可无的"试一试"；他们的提示词精炼，不啰嗦；他们知道什么时候用AI，什么时候直接自己做更快——后者同样重要。

企业ROT：组织部署AI之后，整体生产力提升了多少，相对于Token总成本？

这一层是大多数企业管理者应该建立的看法。企业ROT低，通常有几个原因：AI接入的是低价值、低重复度的边缘场景，主流业务流程还没有被触及；没有统一的使用规范，全公司各自为政，大量重复劳动在Token层面浪费；没有建立共享的知识库和提示词库，每个人都在重新发明轮子。

平台ROT：对于做AI工具和平台的团队，这一层最关键——每消耗一个Token，给平台上的用户带来了多少价值，以及由此产生的平台黏性和生态效应？

这一层的逻辑和微信每条消息带来的价值相似：单条消息价值很低，但它在维护一个社交关系网络，而这个网络的价值远超任何单条消息。平台ROT思维，要求你把Token成本放在整个生态价值里来衡量，而不只是看单次请求。

提升ROT的四个杠杆

说了这么多，实际能做什么？

杠杆一：任务选择精准

不是所有任务都值得用AI，更不是所有任务的ROT都值得优化。先做一件事：把你或你团队最常用AI处理的任务列出来，估算每类任务的ROT。你会很快发现，有些任务ROT极高，有些极低——把资源集中在前者，是最容易被忽视、但效果最立竿见影的优化。

高ROT任务通常具备：重复性高（同样的任务要做很多次）、标准化程度高（有明确的输入输出格式）、人工替代成本高（需要大量专业时间）。

杠杆二：提示词工程

这是ROT提升最立竿见影的手段，也是最被低估的一项技能。好的提示词能让同样的模型在同样的任务上，产出质量和效率同时提升2到5倍。

核心原则：精准优于啰嗦；结构化优于散文；给示例优于给解释。一个包含三个清晰例子的提示词，通常比一篇解释了半天"你要做什么"的长文提示词有效得多。

杠杆三：上下文管理

这是目前最被忽视的成本黑洞。随着对话变长，每次请求的Token成本线性增加，但有效信息密度在稀释。大量Token花在了"让AI记住之前说了什么"上，而不是在真正的推理和生成上。

解决方案：定期压缩上下文，用经过浓缩的摘要替代原始对话历史。这一项优化，通常能降低40%到60%的Token消耗，而产出质量几乎没有损失。

杠杆四：模型路由

这是企业层面最容易实现、但执行上最需要纪律的优化。把所有任务都交给最贵的模型处理，是ROT的最大杀手。

建立三层分级：简单任务（分类、格式化、摘要）用便宜的小模型；中等任务（内容生成、代码补全、数据分析）用中端模型；只有真正需要复杂推理和深度创作的任务，才用顶级模型。不同级别的模型，单价可以差5到20倍。同样的任务量，合理路由之后，总成本通常能降低50%到70%，而质量差异几乎感知不到。

我们在云上龙虾（OpenClaw）里把智能路由做成了系统级功能——自动判断每个请求的复杂度，路由到最合适的模型，不需要用户手动配置。这背后的逻辑，正是ROT思维的工程化实现：让每一个Token都被用在它最有价值的地方。

ROT是一种工程文化，而不只是一个指标

最后，我想把ROT的讨论推到更深一层。

ROT不只是一个计算公式，它代表的是AI时代对"精益"的重新定义。

工业时代的精益生产，精髓是：消除一切不创造价值的动作，让每一道工序恰好在它被需要的时候完成，不多一分，不少一分。这套逻辑，放到AI时代的Token使用上，同样成立：消除一切不创造价值的Token消耗，让每一次模型调用恰好处于它能产生最大价值的场景。

纳瓦尔说过："专业技能是社会通过高薪奖励那些不可替代的人的方式。"

在AI时代，不可替代的人是谁？不是会用AI的人——那已经是及格线了。是那些能把AI用得比别人高效10倍、20倍的人。这种能力，不是靠使用最好的模型，而是靠对工作流程的系统性思考、对提示词的工程化设计、对成本和价值的持续量化。

这是一种工程素养，也是一种管理素养。

ROI是工业时代对"值不值得投入"的判断工具。ROT是AI时代对"用没用对地方"的判断工具。前者问的是要不要，后者问的是怎么用好。

在AI工具触手可及的今天，"要不要用AI"这个问题基本上已经有了答案。剩下的、也是更难回答的问题是：你有没有把AI用在正确的地方，用正确的方式？

ROT，就是回答这个问题的那把尺子。

- End -

免责声明：本期内容由Alpha说编辑团队基于公开信息整理编辑，所有数据均来源于公开媒体报道及企业官方披露，仅供参考，不构成任何投资建议。如需转载或引用，请注明出处。

Alpha说编辑团队