
管理学大师彼得·德鲁克有一句话,被引用了无数次:
"你无法管理你不能量化的东西。"
这句话在AI时代遇到了一个奇特的困境:每家公司都在用AI,AI账单在快速增长,但当你问任何一位管理者"你们公司AI投入的回报是多少",十之八九给不出一个清晰的数字。
这不是懒惰,是方法论的缺失。
我们用了几十年的ROI(投资回报率),放到AI投入上,正在失去解释力。这篇文章想聊一个替代性的指标框架——ROT(Return on Tokens,Token回报率)——以及它背后更重要的一件事:在AI时代,对"效率"的理解需要从根本上更新。

ROI为什么在AI时代失效
ROI的公式是:收益 / 投入 = 回报率。
问题出在"投入"的定义上。ROI诞生于工业时代和金融时代,当时"投入"的主要形态是:资本(采购设备、购置场地)、人力(雇人做事)、时间(项目周期)。这三者都有成熟的会计处理方式,可以被清晰地数字化。
但当你用AI处理1万份简历、每天自动生成50份市场报告、或者让AI智能体代替人工处理客户投诉,你的核心成本是什么?
不是硬件——你不需要自己买GPU;不是人力——AI在做,不是人在做;不是时间——AI处理速度极快。
你的核心成本,是Token。
Token是AI的基本计算单位。你输入的每个字符,AI输出的每段内容,都以Token计费。不同模型的单价差异可以有几十倍,不同的使用方式消耗的Token量可以差几百倍。当AI成本的主体是Token,而不是资本或人力,传统ROI框架就失去了捕捉能力——它的成本端和价值端都对不上。
更深层的问题是:AI的价值很难被财务报表即时呈现。
一家公司用AI把报告生产速度提升了5倍,这5倍速度在哪条财务科目上?没有。节省的人工时间,如果没有裁员,只是"让那些人去做别的事",也没有直接体现为成本节约。ROI算不了,不是因为AI没带来价值,而是因为它带来的价值是生产力密度的提升,而不是传统意义上的"收入增加"或"成本减少"。
这就是我们需要一个新指标的根本原因。

什么是ROT
ROT的定义,我尽量说得直接:
ROT(Return on Tokens)= 产出价值 / Token成本
每消耗一定数量的Token,带来多少可量化的价值。

举三个真实场景的计算:
场景一:内容生产某市场团队,每月用AI生成行业报告和营销文案,总Token成本约200元。同样的工作,如果由两名编辑人工完成,需要两周,成本约2万元。ROT = 20000 / 200 = 100。
场景二:客服自动化一个客服机器人,每月处理10000个咨询,Token成本800元。三名人工客服处理同等工作量,月成本约1.5万元。ROT = 15000 / 800 ≈ 19。
场景三:代码审查工程团队用AI做代码审查,每月Token成本500元。人工审查同量代码,高级工程师需约20小时,成本约4000元。ROT = 4000 / 500 = 8。
你注意到了什么?不同场景的ROT相差十几倍。内容生产的ROT是代码审查的12倍多——不是因为AI写文章比审代码厉害,而是因为不同任务的人工替代成本差异极大。
这是ROT框架最直接的价值:让你看到资源错配。
当你发现你每月Token开销的大头,用在了ROT只有3-5的场景上,而有ROT高达100的场景只占很小一部分——这个发现的价值,比"我们在AI上花了多少钱"这个数字有意义得多。

同一个模型,ROT能差20倍
这是我在实际观察中发现的最令人震惊的现象。
两支团队,使用同一个模型,在同类业务场景下工作,ROT相差将近20倍。不是因为模型能力差距,不是因为业务难度不同,而仅仅是工作方式的不同。
高ROT团队的做法:
系统提示词经过精心设计,每次只包含任务必需的信息,清晰结构化,没有废话
对话上下文定期压缩,用摘要替代原始历史,把每次请求的Token量控制在合理范围内
任务分级,简单的分类和格式化用最便宜的模型,只有真正需要深度推理的任务才用顶级模型
建立了可复用的提示词模板库,常见任务不再每次从零开始
低ROT团队的做法:
没有系统提示词,每次对话都在框里重新解释背景
对话上下文越来越长,越来越贵,但有效信息密度在稀释
所有任务都用最贵的模型,理由是"反正效果最好"
每次从零开始,什么都没有沉淀下来
结果:高ROT团队用了低ROT团队约1/5的费用,产出了3-4倍的有效工作量。

这不是能力的差距,这是工程化程度的差距。
把这个现象往更深处想,它其实在说一件事:AI时代,技术本身不再是护城河,使用技术的方法论才是。OpenAI的模型所有人都能调,贵贱区别在怎么用。就像同样一把好刀,厨师和普通人用起来结果完全不同——刀的质量分高下,用刀的技艺分高下,但后者的差异往往更大。

ROT的三个层级
ROT不只是一个任务层面的指标。它有三个层级,从个人到企业到生态,每一层的管理逻辑不同。

个人ROT:你作为个人用户,每天消耗的Token,带来了多少效率提升?
这一层最容易被忽视,也最容易被优化。高个人ROT的人,通常具备以下特征:他们用AI处理的是高频、高价值的任务,而不是可有可无的"试一试";他们的提示词精炼,不啰嗦;他们知道什么时候用AI,什么时候直接自己做更快——后者同样重要。
企业ROT:组织部署AI之后,整体生产力提升了多少,相对于Token总成本?
这一层是大多数企业管理者应该建立的看法。企业ROT低,通常有几个原因:AI接入的是低价值、低重复度的边缘场景,主流业务流程还没有被触及;没有统一的使用规范,全公司各自为政,大量重复劳动在Token层面浪费;没有建立共享的知识库和提示词库,每个人都在重新发明轮子。
平台ROT:对于做AI工具和平台的团队,这一层最关键——每消耗一个Token,给平台上的用户带来了多少价值,以及由此产生的平台黏性和生态效应?
这一层的逻辑和微信每条消息带来的价值相似:单条消息价值很低,但它在维护一个社交关系网络,而这个网络的价值远超任何单条消息。平台ROT思维,要求你把Token成本放在整个生态价值里来衡量,而不只是看单次请求。

提升ROT的四个杠杆
说了这么多,实际能做什么?

杠杆一:任务选择精准
不是所有任务都值得用AI,更不是所有任务的ROT都值得优化。先做一件事:把你或你团队最常用AI处理的任务列出来,估算每类任务的ROT。你会很快发现,有些任务ROT极高,有些极低——把资源集中在前者,是最容易被忽视、但效果最立竿见影的优化。
高ROT任务通常具备:重复性高(同样的任务要做很多次)、标准化程度高(有明确的输入输出格式)、人工替代成本高(需要大量专业时间)。
杠杆二:提示词工程
这是ROT提升最立竿见影的手段,也是最被低估的一项技能。好的提示词能让同样的模型在同样的任务上,产出质量和效率同时提升2到5倍。
核心原则:精准优于啰嗦;结构化优于散文;给示例优于给解释。一个包含三个清晰例子的提示词,通常比一篇解释了半天"你要做什么"的长文提示词有效得多。
杠杆三:上下文管理
这是目前最被忽视的成本黑洞。随着对话变长,每次请求的Token成本线性增加,但有效信息密度在稀释。大量Token花在了"让AI记住之前说了什么"上,而不是在真正的推理和生成上。
解决方案:定期压缩上下文,用经过浓缩的摘要替代原始对话历史。这一项优化,通常能降低40%到60%的Token消耗,而产出质量几乎没有损失。
杠杆四:模型路由
这是企业层面最容易实现、但执行上最需要纪律的优化。把所有任务都交给最贵的模型处理,是ROT的最大杀手。
建立三层分级:简单任务(分类、格式化、摘要)用便宜的小模型;中等任务(内容生成、代码补全、数据分析)用中端模型;只有真正需要复杂推理和深度创作的任务,才用顶级模型。不同级别的模型,单价可以差5到20倍。同样的任务量,合理路由之后,总成本通常能降低50%到70%,而质量差异几乎感知不到。
我们在云上龙虾(OpenClaw)里把智能路由做成了系统级功能——自动判断每个请求的复杂度,路由到最合适的模型,不需要用户手动配置。这背后的逻辑,正是ROT思维的工程化实现:让每一个Token都被用在它最有价值的地方。

ROT是一种工程文化,而不只是一个指标
最后,我想把ROT的讨论推到更深一层。
ROT不只是一个计算公式,它代表的是AI时代对"精益"的重新定义。
工业时代的精益生产,精髓是:消除一切不创造价值的动作,让每一道工序恰好在它被需要的时候完成,不多一分,不少一分。这套逻辑,放到AI时代的Token使用上,同样成立:消除一切不创造价值的Token消耗,让每一次模型调用恰好处于它能产生最大价值的场景。
纳瓦尔说过:"专业技能是社会通过高薪奖励那些不可替代的人的方式。"
在AI时代,不可替代的人是谁?不是会用AI的人——那已经是及格线了。是那些能把AI用得比别人高效10倍、20倍的人。这种能力,不是靠使用最好的模型,而是靠对工作流程的系统性思考、对提示词的工程化设计、对成本和价值的持续量化。
这是一种工程素养,也是一种管理素养。
ROI是工业时代对"值不值得投入"的判断工具。ROT是AI时代对"用没用对地方"的判断工具。前者问的是要不要,后者问的是怎么用好。
在AI工具触手可及的今天,"要不要用AI"这个问题基本上已经有了答案。剩下的、也是更难回答的问题是:你有没有把AI用在正确的地方,用正确的方式?
ROT,就是回答这个问题的那把尺子。
- End -


免责声明:本期内容由Alpha说编辑团队基于公开信息整理编辑,所有数据均来源于公开媒体报道及企业官方披露,仅供参考,不构成任何投资建议。如需转载或引用,请注明出处。
Alpha说编辑团队

夜雨聆风