AI 公司开始省钱了,这说明大模型真的进入日常工作了
今天刷到一条新闻,蛮有意思的。
说有公司开始嫌 AI 太贵了。
这话听起来有点抽象,但我自己还挺有体感的,因为我们公司也遇到过 token 花超的情况。
那种感觉很微妙。
不是说 AI 不好用。
恰恰相反,是因为太好用了,所以大家什么都想丢进去,什么都想让它跑一下。
然后某一天,账单来了。
人就突然冷静了。

图源,IT之家 转引 CNBC / X 截图
IT之家转引 CNBC 的报道里,提到了一家叫 Lindy 的公司,大概 25 个人,总部在旧金山,之前主要用 Anthropic 的 Claude。然后他们 CEO 说了一件很离谱的事。
他们每个月的 AI 账单,甚至超过了所有员工的工资支出。
我看到这句的时候,是真的愣了一下。
因为过去这两年,大家聊 AI 成本,聊的都是很宏大的东西,什么算力、芯片、数据中心、能源、资本开支。
这些当然很重要,但离普通人太远了。
如果你去跟一个普通老板说,训练大模型要花几十亿美元,他会点点头,然后觉得这是硅谷的事。
但如果你跟他说,一个 25 人小公司,AI 的账单能比员工的工资单还要大。
这感觉可就完全不一样了。
工资单是什么?
是老板每个月必看的东西。
是公司活着的体温计。
AI 账单一旦超过工资单,这事就不再是技术新闻了。
这是财务新闻。
更骚的是,这家公司后来把流量 100% 切到了 DeepSeek,并且说未来几个月可能省下几百万美元。

图源,IT之家 转引 Flo Crivello / X 截图
你看,这个事突然就变得有意思起来了。
过去我们讨论模型,喜欢问谁更聪明。
现在老板开始问,谁更便宜。
这句话听着可能有点俗。
但我觉得,这恰恰说明 AI 真的进入日常工作了。
一个东西刚出现的时候,大家通常是不算账的。
因为它还在炫技阶段。
第一次用 ChatGPT 的时候,你不会去算这段回答消耗了多少 token。你只会觉得,卧槽,这玩意能写作文,能翻译,能写代码,还能陪我聊天。
第一次用 Claude Code 或者 Codex 的时候,你也不会先关心成本。你会盯着它一行一行改代码,心里想的是,这玩意是不是能替我干活。
这很正常。
任何新技术刚出现的时候,人都会先兴奋。
电灯刚出现的时候,大家先震撼的是,夜晚居然可以被点亮。
汽车刚出现的时候,大家先震撼的是,人居然可以不靠马跑这么远。
互联网刚出现的时候,大家先震撼的是,我居然可以给地球另一边的人发邮件。
但只要一个东西真的开始进入日常,它迟早会进入一个非常无聊,但也非常真实的阶段。
算账。
电灯要算电费。
汽车要算油费。
云服务要算服务器费。
AI 也一样。
只要它从一个玩具,变成公司每天都要用的生产资料,它就一定会被财务部拽回来。
你到底给我省了多少钱。
你到底帮我多赚了多少钱。
你到底有没有贵到离谱。
这才是这条新闻真正有意思的地方。
它不是说 DeepSeek 赢了,Claude 输了。
如果只把它理解成国产模型大战海外模型,我觉得就有点小了。

图源,IT之家 转引 Flo Crivello / X 截图
真正大的变化是,企业开始进入 AI 成本敏感期了。
以前公司用 AI,像小孩第一次进游乐园,看到什么都想试。
这个模型也接一下,那个 agent 也买一下,会议纪要要 AI,客服要 AI,销售要 AI,代码也要 AI,内容也要 AI。
反正预算先花着。
先把故事讲起来。
先让老板知道我们也在拥抱 AI。
但现在,账单开始来了。
而账单是这个世界上最朴素的清醒剂。
你可以在 PPT 里写很多愿景,但账单会问你一个很简单的问题。
这钱,花得值吗?
说到这里,可以顺着聊一个以前大家不太在意,但以后会越来越重要的词。
token minimizing。
大概意思就是,用更少的 token,完成同样复杂度的任务。
听起来很技术,其实非常好理解。
就是别废话。
以前我们用 AI,经常会给它一大堆上下文,扔进去几十页文档,反正大上下文很爽,越长越有安全感。
但你想想看,如果一个公司每天有几百个员工、几千个任务、几万次调用,每一次都把十万字上下文丢进去,这个成本会非常恐怖。
你自己用的时候,最多是额度没了,骂一句,又限流了。
公司用的时候,那就是一张一张真实的发票。
所以以后企业一定会越来越关心一个问题。
不是哪个模型最强。
而是哪件事,应该用哪个模型。
这就引出了另一个很关键的东西,模型路由。
这个词听起来也很工程,但其实你可以把它理解成,一个公司终于不再让法拉利去买菜了。
写个邮件,用一个模型。
改个错别字,用一个模型。
分析几十页合同,用一个模型。
跑 coding agent,用一个模型。
涉及客户隐私的数据,也许就别出门了,走本地或者私有化。
长上下文任务,也许先压缩一下,别一上来就把整个仓库、整个飞书文档、整个 Notion 工作区全部塞进去。
这事听起来很琐碎。
但这些琐碎的地方,就是钱。
它不会再让每一个员工自己决定用哪个模型。
因为员工很难关心成本。
说实话,大多数人也不应该关心。
你让一个销售每天判断,这个客户邮件该用 Claude 还是 DeepSeek,太反人性了。
你让一个运营每天判断,这个表格总结该走 GPT 还是 Qwen,也很荒唐。
普通用户真正想要的是,事情被做好。
至于后面用的是哪个模型,怎么路由,怎么省 token,那应该是系统的事。
这也是为什么我最近越来越觉得,模型路由可能会变成 AI 时代的一个基础设施。
它不是最性感的东西。
但它很像公司里的水电管线。
平时没人关心。
一旦出问题,全公司都知道。
我自己其实对这个变化挺有感触的。
因为我们现在用 AI,也经常会经历一种很微妙的心理变化。
刚开始用的时候,什么都想让最强模型来。
写文章,让最强的。
写代码,让最强的。
分析资料,让最强的。
甚至有时候只是让它帮我润色一句话,我也下意识觉得,能不能上最好的。
我就想看看它到底能有多强。
就像小时候第一次吃自助餐,总觉得要把最贵的东西先吃到嘴里尝尝咸淡。
但用久了以后,会慢慢发现,很多任务压根不需要最强模型来做。
比如一个普通翻译任务,真的需要上最贵的模型吗?
比如只是把一段会议纪要整理成待办,真的需要一个推理能力拉满的模型吗?
比如只是把一段话改得客气一点,真的需要请一个博士后过来吗?
只有少数任务,真的需要那个最贵、最强、最会推理的模型。
模型不是越强越好。
模型是要刚好够用。
这句话可能会成为未来几年企业 AI 落地里非常重要的一句话。
而一旦进入商业问题,很多事情就会变得更冷静。
企业会开始限制员工随便调用最贵模型,AI 产品会开始提供更细的账单和用量分析,老板会开始问每个部门的 AI ROI 到底怎么算。
产品经理会开始设计更短的 prompt,更干净的上下文,更少的重复调用。
开发者也会开始认真思考,哪些上下文真的要传,哪些上下文只是心理安慰。
这件事其实蛮有意思的。
因为过去我们总觉得 AI 的竞争,是模型能力的竞争。
谁更聪明,谁就赢。
但当 AI 真正进入日常工作以后,竞争就会变成一堆很朴素的东西。
谁更便宜。
谁更稳定。
谁更容易接进现有系统。
谁的账单更清楚。
谁能让老板少焦虑一点。
这些东西听起来一点都不酷。
但它们才是一个技术真正落地以后每天要面对的东西。
我有时候觉得,AI 行业过去两年特别像一个极度兴奋的创业者,天天在说,我要改变世界。
现在,财务把门推开了。
财务说,好的,那你先解释一下这个月为什么多花了二十万。
那一刻,世界突然真实了。
很残酷,但也很健康。
因为一个行业如果永远只会讲想象力,不会算账,它就很难真正长大。
真正的基础设施,不是永远贵得像奢侈品。
真正的基础设施,是大家每天都用,但用的时候不会心疼。
水是这样。
电是这样。
云服务是这样。
未来 AI 如果真的要成为每家公司、每个人的日常基础设施,它也必须走到这一步。
不是每一次调用都像点了一瓶香槟。
而是像拧开水龙头。
你当然要付钱。
但你不会每次拧开水龙头都心惊胆战。
这就是 DeepSeek 在这条新闻里让我觉得有意思的地方。
它不只是一个更便宜的模型选择。
它像是在提醒整个行业,AI 不是只要变强就够了。
它还要变得能被长期使用。
你不能只在 demo 里惊艳。
你还得在账单里活下来。
这句话,我觉得对所有 AI 产品都成立。
Agent 也一样。
如果一个 Agent 干一次活,要烧掉一堆 token,跑半小时,到头来还需要人类返工,那它再聪明,也很难成为日常工作流。
如果一个 Agent 能用合适的模型、合适的上下文、合适的工具,把一件小事稳定做完,而且成本低到你愿意每天用。
那它才真的开始可怕。
不是那种发布会上很可怕。
是生活里很可怕。
你会发现,每天生活里那些很烦的小事,真的可以被一点点吃掉。
生活被 AI 一点点占据。
所以回到最开始这条新闻。
我不觉得它只是「美国企业开始用 DeepSeek」。
这个说法太小了。
我觉得它更像是一个信号。
AI 开始从炫技阶段,进入财务阶段。
从「你看我多聪明」,进入「你看我多划算」。
从模型榜单,进入公司账单。
这可能才是 AI 普及真正开始的样子。
不是所有人都在热血沸腾地说,AGI 要来了。
而是某个周一早上,一个老板打开账单,皱着眉头问了一句。
这钱能不能省一点?
有时候,技术革命不是从掌声开始的。
是从报销单开始的。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标~
谢谢你看我的文章,我们,下次再见。
夜雨聆风