假设你开了一个健身房。
月卡300块,来了1000个会员。你的成本是多少?房租、器械折旧、水电——这些是固定的。多一个会员,边际成本约等于零。会员越多,你越赚钱。
现在假设你开了一个AI写作工具。
月卡30块,来了1000个用户。你的成本是多少?房租省了(没有实体场地),但每用户每次调用都要烧GPU推理算力。重度用户一天调用几百次,你的GPU成本可能比他交的月费还高。
多一个用户,不是多赚一份钱,可能是多亏一份钱。
💡 核心洞察:传统软件(SaaS)和AI产品是两种完全不同的生意——SaaS的边际成本趋近于零,AI产品的边际成本随用量线性增长。这个差异被称为"Token Tax"(令牌税),它从根本上重写了AI创业的定价规则。超过三分之一的AI原生公司已经转向"订阅+用量"混合定价,而纯订阅模式正在成为例外。

一、"Token Tax":AI时代的土地税
先解释一个词。
Token(令牌)是AI模型处理文本的最小单位。大约750个英文单词≈1000个token。你向AI模型发送一段话、让它生成一篇文章、让它分析一张图——每一次操作都消耗token,每一次消耗都产生成本。
这就是"Token Tax"——AI创业者的隐形税。
打个比方:传统SaaS像健身房月卡——你交了月费,去一次和去三十次,对健身房的成本差异可以忽略。而AI产品像私教课——你上一节课,教练就得花一小时陪你,这一小时的人力成本是实打实的。来的人越多,教练成本越高。
这个类比直接点破了为什么AI定价不能照搬SaaS。

用一张对比表说清楚:

看到区别了吗?SaaS的成本结构是"固定成本",AI的成本结构是"变动成本"。 这个差异决定了你不能用同一套定价逻辑。
二、2026年的定价实验:三种模式正在决出胜负
好消息是,行业已经跑出了一些答案。坏消息是,很多创业者还在用错的那套。
模式1:纯订阅(SaaS经典模式)
代表:ChatGPT Plus(20美元/月)、Notion AI附加(10美元/月)
适合:消费者市场,用户喜欢可预测的支出。但在企业市场,高用量客户会吃掉你的利润。
模式2:纯用量计费
代表:API产品(按token付费)
适合:开发者市场和企业重度用户。但对轻度用户不友好——他们可能每月只花2块钱,但你收单笔交易的手续费都比这高。
模式3:混合定价(订阅+用量)
代表:Monday.com(基础SaaS订阅+AI功能按使用量加收)
2026年Q1,Monday.com的AI功能贡献了10%的净新增ARR(年度经常性收入)[1]。模式很简单:基础订阅管核心功能,AI能力按量加收。
超过三分之一的AI原生公司已经采用了这种混合模式[2]。纯订阅正在从默认选项变成例外。
🧠 费曼类比:混合定价就像手机套餐——月租费管基础通话分钟数(你的轻度使用被覆盖了),超出部分按量收费(重度用户为你贡献更多利润)。电信运营商几十年来一直用这个模型,因为它同时解决了"可预测性"和"成本覆盖"两个问题。

三、信号墙:三组数据交叉验证
这不是理论推演,而是已经发生的事实。三组数据同时指向同一个结论:
信号1:智谱API涨价83%,调用量反增400%。
2026年Q1,智谱AI将API价格上调83%[3]。按照传统经济学,涨价应该导致需求下降。但结果完全相反——调用量增长了400%,MaaS平台ARR(年化收入)达到17亿元,同比增长60倍[3]。
这意味着什么?当AI能力已经嵌入客户的核心业务流程时,价格上涨不会赶走用户——因为他们离不开你。 智谱同时具备了产品差异化(中文场景表现好)、生态锁定(深度集成)、需求刚性(已嵌入业务流程)三个定价权条件。
但这也是一个警告:API成本长期趋势是上涨的,不是下降的。 你的定价模型必须能承受上游涨价。
信号2:1/3 AI原生公司已转向混合定价。
根据SaaStr/ICONIQ的B2B报告[2],超过三分之一的AI原生公司采用"订阅+用量"混合模型,这个比例还在加速增长。纯SaaS订阅占比持续下降。
信号3:AI Agent开始自主购买工具。
2026年出现了一个新趋势:AI Agent(智能体)开始自主决策调用哪些API、购买哪些工具。这意味着定价不再只面向人类决策者——你的API和计费接口需要同时面向Agent设计[2]。
三个信号叠加,指向同一个判断:AI定价不是"加一个AI功能收费"这么简单,而是整个商业模式架构需要重建。
四、给创业者的决策清单
如果你正在做或准备做AI产品,以下是从第一天就需要回答的问题:
第1题:你的单位经济模型(Unit Economics)成立吗?
算一笔账:用户月费 - 每用户平均推理成本 - 其他成本 = 利润。如果推理成本占月费的50%以上,你就是在给GPU厂商打工。
第2题:你有用量计费组件吗?
最安全的起步策略是混合定价——基础订阅覆盖轻度用户(他们的推理成本低),用量附加捕获重度用户(他们为你贡献更多收入)。不要All-in纯用量,那会吓跑轻度用户;也不要All-in纯订阅,那会在重度用户身上亏钱。
第3题:你监控每用户推理成本了吗?
设置每用户成本上限(Cost Cap)。当某个用户的推理成本超过其月费的N倍时,自动降级模型或限制频率。这不是惩罚用户,而是保护你的生意。
第4题:你的API面向Agent设计了吗?
2026年开始,越来越多的"买家"不是人类,而是AI Agent。它们会自主搜索、比较、调用API。你的定价页面对Agent友好吗?你的API文档可被Agent解析吗?你的计费模型支持Agent的用量模式吗?
第5题:你有多模型路由吗?
不要锁定单一模型提供商。智谱涨83%的案例说明——API成本你不可控,但模型路由策略可控。在便宜模型和昂贵模型之间动态切换,按任务复杂度路由,是AI时代的基础工程。

Monday.com的定价页——基础订阅+AI功能按量加收的混合定价实例[1]。
五、更大的图景:谁在收"土地税"
让我把视角拉高一层。
Token Tax的本质不只是"成本问题",它是一个权力结构问题。
谁控制了推理算力,谁就向所有AI产品收税。NVIDIA卖GPU,是在收硬件税。OpenAI/Anthropic卖API,是在收模型税。AWS/Azure/GCP卖GPU实例,是在收基础设施税。
作为AI创业者,你的每一笔推理成本,最终都在向这条链条上的某个玩家交税。
你的定价策略,本质上是在回答一个问题:你愿意向谁交税、交多少、以及你能不能把税转嫁给用户?
混合定价 = 把一部分税转嫁给高用量用户。
多模型路由 = 选择税最低的供应商。
自建推理 = 消除模型税,但承担硬件税和运维成本。
没有完美答案。但意识到你每天都在交税,是做出正确决策的第一步。
大多数创业者的错误不是定价定错了,而是根本没意识到Token Tax的存在——直到某个重度用户一个月烧掉了他三年订阅费总额的推理成本,才发现生意模型不成立。
别等到那天。
✍️ HuangYetSam | AI原生存储者 · 高校AI教师
森度计划:用费曼的方式,讲透每一个AI概念
⭐ 如果你身边有人在用SaaS思维做AI产品,把这篇文章转给他——省下的可能不止是钱
🔗 更多深度分析:https://github.com/yetsam/Obsidian-AI-Vault

参考来源
- 1. Monday.com Q1 2026 — AI功能贡献10%净新增ARR: https://www.earningsiq.co/articles/mondaycom\_mndy\_q1\_2026\_ai\_drives\_10\_of\_net\_new\_arr\_reshaping
- 2. SaaStr/ICONIQ B2B AI Monetization Report 2026 — 1/3 AI-native公司采用混合定价: https://www.saastr.com/the-age-of-ai-the-top-10-gtm-learnings-from-iconiqs-2025-b2b-saas-report/
- 3. 智谱AI API提价83%,调用量增400%,MaaS ARR 17亿 — CIO Intelligence Digest 2026-06-13
- 4. B2B SaaS AI Monetization 2026 — Growth Unhinged: https://www.growthunhinged.com/p/the-state-of-b2b-monetization-in-2026
- 5. AI Monetization vs Traditional SaaS — Token Tax概念: https://like2byte.com/ai-monetization-vs-traditional-saas-failure/
- 6. SaaS & AI Pricing Report 2026 — HY Pricing: https://pricing.hy.co/saas-ai-pricing-report-2026-en/
夜雨聆风