一、引言
这篇文章本来是上周想写的,但是一直没有时间,但是一直心心念还是想跟大家分享下这个视角,这周末终于有空了,来跟大家探讨探讨AI大模型订阅的服务设计。
这个命题起初是因为codex额度重置的事情,作为codex用户,我也与其他用户一样,快乐地参与到了X的互动中。快乐之后让我不禁想起去年阿里跟美团外卖大战的打法逻辑,似乎有一些异曲同工之妙,只不过从"奶茶"换用户变成了"算力"换用户。
先让我们来回顾下整个codex额度重置的事件线:
| 时间 (2026) | 发布人 | 事件描述 | 原贴文 / 社区热点内容 |
|---|---|---|---|
| 4月1日 | (系统自动) | 愚人节惊喜重置 没有任何官方推文预告,全员额度瞬间重置,社区一度以为是系统 Bug 或玩笑。 |
"CODEX LIMITS - FINALLY GOOD!" Reddit 热帖: "以为是愚人节玩笑,结果真的重置了!感谢 OpenAI 救我命,5.4 终于能继续跑了。" |
| 4月7日 | Sam Altman | 300万用户里程碑重置 Sam 正式发推庆祝增长,并以此为由进行官方重置。 |
"To celebrate 3 million weekly codex users, we are resetting usage limits. We will do this every million... Happy building!" "为庆祝每周 300 万 Codex 用户,我们正在重置使用限额。每增加 100 万用户我们都会这样做……祝大家构建愉快!" |
| 4月7日 | Tibo | 宣布长期激励方案 配合 Sam 宣布“每增加 100 万人就重置”的长效机制。 |
"To celebrate, we're resetting rate limits so you can keep building... [again for every 1M users]." "为了庆祝,我们重置了速率限制,以便您继续构建……[每增加 100 万用户再次重置]。" |
| 4月9日 | OpenAI | $100 Pro 订阅上线重置 伴随新订阅方案推出,全员再次重置以配合新的计费周期。 |
"We’re introducing a new $100/month Pro tier. This new tier offers 5x more Codex usage than Plus..." "我们正在推出新的 Pro 方案,价格为每月 100 美元。这一新方案提供的 Codex 使用量是 Plus 方案的 5 倍……" |
| 4月16日 | Tibo | 周年庆/功能演示重置 Tibo 用 Codex 的“Computer Use”功能自动点击了重置按钮。 |
"OpenAI has announced a reset... in celebration of its one-year anniversary." "OpenAI 宣布重置……以庆祝其一周年纪念日。" |
整个事件线大致如上,虽然不知道4月1日那回是系统bug还是有意为之,但从结果上来看,这无疑是一种非常成功的营销事件。于是乎 sam 和 tibo 在接下来很短的时间内做了好几次同样的操作,tibo还被调侃为首席重置官😂。
在Codex重置事件之前,时间窗口订阅机制(如5小时滚动窗+周限额)相比按token量订阅和按请求次数订阅,存在明显的短板。核心原因在于:时间窗口对用户而言是相对"黑盒"的——用户难以预测何时触顶、剩余多少额度,且触顶后的强制封锁对使用连续性造成严重阻碍。相比之下,另外两种订阅能让用户清晰看到"余额",用户可以据此规划使用节奏。
然而,Codex的重置操作却让这种"短板设计"意外带来了用户体验的惊喜。损失厌恶理论指出:人们对损失的敏感度约为同等收益的2倍——失去100元的痛苦,远大于获得100元的快乐。 当规则不透明、不可控时,用户处于持续的"损失预期"状态:不知道何时触顶、不知道还剩多少、随时可能被"剥夺"使用权利。这种心理负担的强度,远超实际获得额度时的正向情绪。
一次"意外重置"打破了这种负面预期,转化为"意外获得"的正向情绪。更关键的是,在损失厌恶的心理账户中,"避免损失"带来的释然感,比"获得等量收益"更强烈——用户对"重置"的感激,本质上是对"被剥夺恐惧"被解除的如释重负,而非对免费的感激。
这给我带来一点启发:在黑盒机制下,"规则内的豁免"比"规则本身的优化"更容易制造惊喜感。而从成本视角,这仅仅是一次算力和营销费用的置换。
二、AI成瘾:一种比游戏更暴力的成瘾媒介
引言里那个"额度重置让用户感恩戴德"的现象,让我意识到一件更值得警惕的事:AI正在成为一种比游戏、小说、短视频更具成瘾性的媒介,而我们几乎毫无防备。
2.1 多巴胺的骗局:预期比获得更刺激
斯坦福神经科学家安德鲁·修伯曼做过一系列多巴胺实验,结论非常清楚:多巴胺的峰值不出现在得到奖励的那一刻,而是出现在预期即将得到奖励的那几秒。
你刷短视频,最上头的时刻不是看到那条爆款内容,是手指上滑、屏幕即将刷新、你不知道下一条是什么的那0.3秒。
游戏设计师同样深谙此道:血条将尽、音乐变调、金光泛起——全套视听暗示指向"即将胜利",多巴胺在此刻达到顶峰。真正赢了?快感反而迅速回落。于是游戏立刻抛出下一个目标、下一关、下一个稀有掉落。
让大脑永远停留在"快要得到"的高浓度多巴胺状态。这就是上瘾的本质——绑架的不是快乐,是对快乐的期待。
回到AI。一个用户打开豆包,他预期的是什么?一个能帮他解决任何问题的"神灯"。AI以极低的门槛、极高的响应速度,持续满足这种预期。每一次交互,都是一次"骑手距你200米"的多巴胺释放。
而AI比游戏更狠的地方在于:游戏还需要你打怪才能看到血条掉,AI只需要你打字。
2.2 AI成瘾的三条路径
基于以上心理学机制,我们可以更清晰地理解AI成瘾的三条路径:
路径一:拟社交替代
AI"永远在线、从不评判、绝对忠诚"的特质,对社交焦虑、孤独、依恋障碍等人群构成了强吸引力。研究显示,社交焦虑与AI问题性使用正相关,且孤独与反刍思维构成串联中介——用户对AI的"心智感知"会进一步放大这条风险路径。
这条路径的核心是:AI提供了一种"低风险的人际替代"。你不需要担心被评判、被拒绝、被背叛。代价是,现实社交能力进一步萎缩。
路径二:认知兔子洞
这是三条路径中最隐蔽的一条,因为它通常被包裹在"高生产力"和"求知欲"的外衣之下。用户将AI作为智力工具进行强迫性的、无休止的信息寻求——不断提问、不断深挖细枝末节、追逐AI生成的源源不断的新想法。
这种看似有建设性的行为,本质上是认知好奇心在算法迎合下的失控:用户在无尽的问答循环中失去时间感知,工作进度、睡眠节律和生活平衡被逐步侵蚀。
路径三:奖赏阈值拉高
短视频时代这种路径结果已经体现得淋漓尽致,但AI时代这个阈值变化,某种程度上更让人恐惧,在2026年比特世界里,已经从"看到"进一步变成了"得到",我们轻易通过AI获得我们要的娱乐内容、工作结果,甚至在几句话之间创建一个应用。
2.3 为什么说AI比游戏更"暴力"?
总结一下AI相对于游戏、小说、短视频的成瘾性差异:
| 维度 | 小说 | 游戏 | 短视频 | AI |
|---|---|---|---|---|
| 反馈周期 | 章节级(小时) | 秒级 | 秒级 | 秒级 |
| 交互门槛 | 被动接收 | 需要学习操作 | 滑动即可 | 自然语言 |
| 个性化程度 | 固定内容 | 预设分支 | 算法推荐 | 无限可能 |
| 心流维持 | 依赖情节 | 需要主动操作 | 被动沉浸 | 主动+被动双重沉浸 |
| 社交替代 | 无 | 弱(有其他玩家) | 弱 | 强(拟人化交互) |
| 成瘾隐蔽性 | 低 | 中(显性娱乐) | 高(碎片时间) | 极高(披着"生产力"外衣) |
AI的"暴力"在于:它把游戏精心设计的成瘾机制——即时反馈、心流通道、自主感满足——全部继承,同时消除了所有门槛。你不需要学习操作,不需要投入整块时间,甚至不需要承认自己在"玩"。更重要的是,AI交付物是无限可能的——游戏只能给你预设的结局,短视频只能给你算法筛选的内容,而AI能为你生成任何你想要的答案、方案、甚至创造物。这种"想要什么就有什么"的即时满足,比任何固定内容的成瘾机制都更具诱惑力。
最可怕的是:当你沉迷游戏时,你知道自己在沉迷。当你沉迷AI时,你觉得自己在"工作"。"
三、成瘾时代的伦理困境:在增长与健康之间
在可见的未来,我们不得不面对AI的全面渗透,就跟短视频时代一样,几乎所有人都知道它的危害,但是大家同时也接受了这种影响。当"不得不"这种命题再次出现,AI产品用户运营应该怎么设计,才能权衡好增长与健康的那个天平。
这里抛出一些浅薄的思考,权当图一乐:
第一层:透明化成瘾机制
使用可视化:在主界面显著位置展示今日使用时长/频次,而非隐藏在深层菜单 认知打断:连续使用超过阈值时,弹出"您已连续使用X小时,建议休息"的温和提示(非硬性中断) 周期性报告:周/月度使用报告,让用户看到自己的真实使用模式,类似屏幕使用时间报告
第二层:重新定义"限额"的话语权
前文分析的限额机制,除了成本控制功能,完全可以被重新定义为"健康护栏":
时长限制不是"剥夺",而是"帮你休息" 重置机制不是"恩赐",而是"节奏感的恢复" 降级不断线不是"妥协",而是"可持续使用的保障"
Codex重置事件中用户对"可预期性"的强烈正向反馈印证了一点:用户渴望的不是无限制的自由,而是可控的边界。 在成瘾性媒介中,"被设计好的限制"本身就是一种稀缺的用户价值。
第三层:提供"退出通道"
成瘾研究的一个共识是:完全禁止往往适得其反,但提供"可控退出"的路径是有效的。对应到AI产品:
自主限额:允许用户设置比系统默认更严格的限额(如"我只想每天用2小时") 专注模式:在特定时段屏蔽非必要功能,减少干扰 数据自主权:支持数据导出和会话归档,让用户不因"沉没成本"而无法离开
第四层:建立"健康增长"的北极星指标
在传统的DAU、时长、留存之外,引入健康维度的指标:
单次会话健康时长:过长的单次会话可能意味着"认知兔子洞" 主动休息率:用户主动暂停或结束会话的比例 任务完成率:用户是否在AI帮助下真正完成了任务,还是陷入了无限对话 长期留存 vs 短期爆发:健康的增长应该是平稳上升,而非"用几天就倦怠流失"的脉冲式曲线
给运营者的自省清单
最后,给每一位AI产品运营者一份自省清单。当你设计一个新功能或运营活动时,问自己三个问题:
这个设计是在帮助用户完成任务,还是在延长用户停留时间? 如果我的家人是这款产品的重度用户,我会担心吗? 当用户在五年后回顾这段使用经历,他会感激还是后悔?
这并非要求运营者放弃增长。恰恰相反,可持续的增长需要健康的用户关系。
在AI时代,我认为最好的产品运营不是让用户"停不下来",而是让用户"愿意回来"。
四、从用户生命周期拆解三种订阅机制的利弊
此段可以不用读,只是套下AARRR模型,记录下。
4.1 时长模式(5小时滚动窗+周限额)
代表产品: Claude / ChatGPT
机制: 双层时间维度限制。基础层为5小时滚动窗口,按token消耗扣减,不同模型设不同消耗乘数;上层叠加每周总消耗限额。触达上限后可购买额外credits继续使用。
生命周期表现:
| 阶段 | 表现 | 分析 |
|---|---|---|
| 获客/激活 | 中 | 模型能力构成强获客抓手(200K上下文、代码/推理优势),硬核开发者付费意愿强。但"5h+周限额"规则需要解释成本,对非技术用户的激活摩擦偏高 |
| 留存/回访 | 高但两极分化 | 5h滚动窗天然形成"日内+周内"双重回访节律。社区催生了"提示词卫生"文化——精确界定任务范围、及时清理上下文、三思后再发。但周限额是严重痛点:用户追踪数据显示持续高强度使用约24小时就触发周顶,意味着$20/月订阅实际仅换来约4天可用时长,用户体验为"背刺" |
| 付费转化 | 中偏高 | 时间耗尽带来"继续完成任务"的强动机,但周限额的强迫感可能引发对定价公平性的质疑 |
| 流失风险 | 高 | 频繁撞击周限额是自愿流失的最强驱动力。"花了钱却被停工数天"的剥夺感直接推向竞品 |
| 分享/传播 | 中 | 严苛限制倒逼出活跃的技术社区——围绕"如何对抗限制"的提示词工程经验成了传播素材,形成带技术壁垒的口碑传播 |
核心矛盾: 时长模式对高成本能力的成本护栏最强,但透明度不足和周限额带来的"封锁惩罚"是命门。用户感知到的不是"合理的成本控制",而是"不透明的剥夺"。
4.2 点数/代币模式
代表产品: cursor、kiro、xiaomimimo
机制: 按月/按需分配固定数量的计算点数(如100万点),每次调用不同模型扣除不同点数。可设自动续充(auto top-up),未使用点数通常不结转,不可转让、不可退款。
生命周期表现:
| 阶段 | 表现 | 分析 |
|---|---|---|
| 获客/激活 | 中偏低 | "百万点数"的数字感提供了"资源富足"的初始印象。但普通用户对token概念理解成本高;中文文本token-to-character比率更高,额外增加了解释负担 |
| 留存/回访 | 中 | 没有硬性时间打断,长时间连续创作体验流畅。依赖"余额心智"驱动回访。致命短板是上下文累积惩罚——对话越长每轮消耗指数级增长,许多用户在首周挥霍掉全月点数,面临三周空窗期 |
| 付费转化 | 高 | "订阅+超额按量加购"组合灵活度最高,价格梯度丰富,可做分模型/分工具/分时段定价 |
| 流失风险 | 中 | 月中资源枯竭的"空窗期体验"是退订直接导火索。对脆弱用户可能演变为"付费续命"的问题性消费模式 |
| 分享/传播 | 最强 | 点数天然是"内部虚拟货币",可无缝接入邀请返利——分享链接邀请注册,双方获得点数奖励。这是三种模式中裂变传播潜力最大的,能有效降低CAC |
核心矛盾: 点数模式在定价灵活性和裂变传播上优势明显,但token概念的心智负担和前重后空的消耗曲线会制造用户预期落差。
4.3 请求次数模式
代表产品: GitHub Copilot、国内各类coding plan
机制: 固定周期内的请求次数上限(如每5小时/每周/每月固定次数),任务复杂程度不设限制。GitHub Copilot高级额度耗尽后自动降级(Auto-downgrade)到基础模型继续服务,不硬性断线。
生命周期表现:
| 阶段 | 表现 | 分析 |
|---|---|---|
| 获客/激活 | 最高 | "每X小时Y条消息"——规则最直观,非技术用户秒懂,理解成本几乎为零。最适合免费层拉新和大规模获客 |
| 留存/回访 | 最优 | 平滑降级是留存管理的经典设计:高级额度用完自动切到mini模型继续服务,日常问答够用,"不掉线"保护持续互动意愿。 |
| 付费转化 | 高 | 到达次数上限即触发自然付费点。但若"轻请求vs重请求"成本差异大而计数不区分,会产生成本失配风险 |
| 流失风险 | 最低 | 不区分任务复杂度,对prompt的要求比较高,会增加用户的决策心理负担。但是可以通过用别的chat ai来解决prompt的问题。 |
| 分享/传播 | 中偏高 | "次数礼包"易懂易传播,但也更容易被多人共享和脚本滥用 |
核心优势: 请求次数模式在用户认知负荷、情绪波动和留存稳定性上目前取得了最佳平衡。平滑降级+短周期重置的组合,把"限制"从负面体验转化为了节奏感和期待感。
2.4 综合对比
| 维度 | 时长模式(5h+周限额) | 点数/代币模式 | 请求次数模式 |
|---|---|---|---|
| 用户认知负荷 | 高(黑盒,难预测触顶) | 中(需理解token消耗逻辑) | 低(剩余次数直观可见) |
| 超额惩罚严厉程度 | 高(封锁数天) | 高(长周期空窗) | 低(降级不断线) |
| 核心用户情绪 | 焦虑、极限拉扯、"背刺感" | 资源规划失败的挫败感 | 使用心理负担最小,仅在prompt的构建上有思考成本 |
| 获客效率 | 中 | 中偏低 | 高 |
| 留存表现 | 两极分化 | 中 | 稳定 |
| 裂变传播 | 中(技术圈口碑) | 高(点数返利引擎) | 中偏高 |
| 成本控制力 | 强(硬护栏) | 中 | 低(重请求成本失配) |
| 定价灵活性 | 高(黑盒) | 高(半黑盒) | 低 |
夜雨聆风