模型调用价格下降,只是账单里最显眼的一行。真正让公司皱眉的,是把 AI 变成稳定生产力的总成本。
这两天看到一个新闻。
DeepSeek 说,要把旗舰模型的 75% 折扣永久化。
翻译成人话就是,之前像促销一样的便宜,现在变成长期价格。
看到这条的时候,我第一反应是,太好了啊。
模型又降价了。
大家都能用得起了。
AI 的成本曲线继续往下掉。
这不就是过去两年大家一直期待的事情吗?
然后我就又刷到另一条。
微软说,在某些工作场景里,用 AI 的成本已经高过直接付人工工资。
我懵x了。
不是兄弟。
一边模型永久降价。
一边大公司说 AI 用起来比人还贵。
这俩新闻放在一起,就很有那种黑色幽默。
就像你看到奶茶店门口挂了一个牌子,珍珠免费加。
你很开心。
结果结账的时候发现,杯子、吸管、冰块、店租、配送费、会员系统、外卖平台抽成,全算上以后,这杯奶茶还是贵得离谱。
AI 现在有点像这个。
模型单价确实在降。
但公司真正买单的时候,买的从来不只是模型单价。
这可能是很多人对 AI 成本最大的误解。
大家平时聊 AI 便宜,聊的通常是 token 价格。
输入多少钱一百万 token。
输出多少钱一百万 token。
哪个模型降了 50%。
哪个 API 便宜到白菜价。
这些当然重要。
但它们只像账单里最显眼的一行。
真正吓人的,是后面那些一开始看不见的行。
服务器。
显卡。
带宽。
延迟。
工程改造。
数据清洗。
安全审查。
员工培训。
错误兜底。
用户投诉。
合规风险。
还有最容易被忽略的一项,人类监督。
这些东西加起来,才是公司眼里的 AI 成本。
所以你会发现,一个很奇怪的现象出现了。
个人用户觉得 AI 越来越便宜。
公司反而觉得 AI 越来越难算账。
个人用户问的是,我一个月花几十块,能不能多生成几张图,多问几百个问题。
公司问的是,我把客服、销售、财务、法务、代码、数据分析全接进去以后,错一次谁负责,慢一秒亏多少钱,规模扩大十倍账单会不会爆炸。
这完全是两种问题。
普通人买 AI,买的是体验。
公司买 AI,买的是结果。
体验可以有点飘。
结果不能太飘。
你让 ChatGPT 帮你写一封邮件,它写得一般,你可以自己改。
你让 AI 帮公司回复十万个客户,它写错一句,可能就是投诉、退款、舆情,甚至法律问题。
你让 AI 帮你总结一份 PDF,它漏了一个细节,你最多骂一句。
你让 AI 帮金融公司审核合同,它漏了一个条款,那就不是骂一句的事了。
所以公司不是单纯在买聪明。
公司在买稳定。
稳定很贵。
这也是为什么 DeepSeek 降价这件事,当然重要,但它不能单独解释整个行业。
模型降价,像是电价下降。
你家里开灯当然会更便宜。
但如果你要建一个大型商场,电费只是其中一部分。
你还要改线路。
你要配消防。
你要有备用电源。
你要有人巡检。
你要处理用电峰谷。
你要让所有商户都能稳定营业。
AI 也是一样。
个人用模型,很多时候就是打开一个网页。
企业用模型,是把模型接进一套已经跑了很多年的系统。
这套系统可能有 CRM。
有 ERP。
有工单。
有知识库。
有权限。
有审计。
有一堆没人敢动的老代码。
还有一群非常会提出「这个按钮为什么不在右边」的真实用户。
你想让 AI 在这里面干活,就不只是调一个接口。
你得把它变成一个可靠员工。
它要知道自己能看什么数据。
能改什么字段。
能给谁发消息。
遇到不确定的事要不要问人。
做错了能不能追责。
日志有没有记录。
数据会不会泄露。
这些问题,个个都要钱。
而且很烦。
我有时候觉得,AI 公司最喜欢讲的故事,是一个人对着对话框说一句话,然后奇迹发生。
企业里真实发生的故事,经常是一群人开三个月会,讨论这个奇迹到底能不能接进现有系统。
听着很无聊。
但钱就花在这种无聊的地方。
再看 SemiAnalysis 那条数据。
他们看了 43.2 万个真实编码 Agent 请求,发现中位数输入到了 9.6 万 token。
这个数比 3.2 万、6.4 万都要高出一截。
这个数字特别有意思。
因为它提醒我们,Agent 时代的 AI 使用方式,和普通聊天完全不一样。
你平时问一句,今天吃什么。
模型可能只需要看你这一句话。
但一个编码 Agent 开始干活之前,要读项目结构。
读 README。
读相关文件。
读测试。
读报错。
读历史修改。
读你给它的规则。
有时候你还没真正提问,它已经吞进去一大坨上下文。
SemiAnalysis 用了一个很好懂的类比。
9.6 万输入 token,差不多比《了不起的盖茨比》全文还长。
你想象一下。
你只是想让一个 Agent 修个 bug。
它先看了一本小说那么长的上下文。
然后才开始回答你。
这就解释了为什么 Agent 会贵。
贵的不是那几行输出。
贵的是它每次开工前,都要把半个办公室的资料重新读一遍。
人类员工为什么有时候便宜?
不是因为人类脑子运转不要钱。
是因为人类有记忆。
你带一个新人,前三个月很贵。
但他熟了以后,知道谁负责什么,知道哪个系统别碰,知道老板最烦哪种汇报,知道客户上次为什么生气。
这些上下文都存在他脑子里。
AI Agent 现在很多时候还没有这种便宜的长期记忆。
它每次都要重新读。
重新读,就要花钱。
读得越多,账单越厚。
这也是我觉得「AI 很便宜」这个说法需要加个括号。
单次回答,便宜。
简单任务,便宜。
把一个复杂岗位拆给 Agent 做,可能一点都不便宜。
尤其当你还要求它稳定、可控、可追责。
这块其实和微软那个判断刚好能对上。
微软说,在一些场景里,AI 的综合成本已经超过人工工资。
很多人看到这句话可能会觉得离谱。
AI 不是一秒生成吗?
AI 不是不用社保吗?
AI 不是不会请假吗?
但公司算账从来没这么单纯。
一个人类员工的工资,是明面上的成本。
AI 的成本,很多时候藏在系统里。
你要给它接数据。
要让它跑得快。
要让它少犯错。
要有人审核。
要有人处理它犯错后的烂摊子。
要有人维护提示词、知识库、权限、监控。
要有人解释,为什么这个 AI 昨天还好好的,今天突然开始胡说八道。
这些人是谁?
很多时候还是公司原来的员工。
所以公司算到后面会发现,AI 没有直接替掉一整个人。
它先创造了一堆新的管理工作。
这就尴尬了。
你本来想省钱。
结果先招了一个 AI 产品经理。
又招了一个数据工程师。
再招了一个安全同事。
然后法务说,这个不能直接上线。
客服说,这个回答用户听不懂。
销售说,这个口吻不像我们品牌。
老板说,为什么花了这么多钱,效率提升没看见。
一时间无语凝噎。
当然,我不是说 AI 不划算。
我想说的是,AI 划不划算,取决于它替你省掉的是哪一种成本。
如果它替你省掉的是一小时重复劳动,那很好算。
如果它替你省掉的是一个部门的部分沟通成本,也许更值钱。
如果它减少的是一次重大事故,价值可能巨大。
如果它只是把一个便宜的人类任务,变成一个昂贵的系统工程,那账就很难看。
举个很小的例子。
你让 AI 帮一个员工写周报。
这很便宜。
因为错了也没啥。
员工看一眼,改一改,发出去。
你让 AI 自动替公司给客户发报价。
这就不一样。
报价错一位数,客户可能真下单。
条款写错一句,后面可能扯皮。
这时候你就要加审核。
加权限。
加模板。
加日志。
加异常处理。
加人工兜底。
于是同样是生成文字,成本完全不一样。
很多 AI 商业化的坑,就在这里。
Demo 里看起来是同一个能力。
落到业务里,成本差十倍甚至一百倍。
顺着这个再看黄仁勋说的 AI 基建开支。
他预测超大规模云厂商的 AI 基建年度开支,可能从现在的 1 万亿美元,冲到 3 到 4 万亿美元。
这个数字大到有点失真。
普通人很难感受到 4 万亿美元是什么概念。
但你只要记住一件事。
如果 AI 真的已经便宜到可以随便用,为什么全球最有钱的公司还在疯狂买显卡、建数据中心、抢电力?
因为整个系统还远远没有便宜。
模型调用端在降价。
基础设施端在烧钱。
这就像手机流量越来越便宜,但基站、海底光缆、数据中心、芯片工厂,全都要继续砸钱。
普通用户只看到每 GB 几块钱。
运营商看到的是一整张网络。
AI 也是这样。
用户看到的是一次回答。
公司看到的是一条供应链。
芯片。
机房。
电。
散热。
网络。
模型训练。
推理服务。
监控。
安全。
生态。
每一层都要钱。
所以黄仁勋那句话其实很像一个提醒。
AI 的边际使用成本在下降。
AI 的总基础设施成本还在上升。
这两个判断可以同时成立。
很多争论之所以吵不明白,就是大家没分清这两个账本。
一个是你我打开 ChatGPT、DeepSeek、Gemini 看到的小账本。
一个是云厂商、模型公司、企业客户背后的大账本。
小账本越来越好看。
大账本越来越吓人。
这事儿一点都不矛盾。
再说一个容易被忽略的点。
AI 越便宜,大家越容易乱用。
这听着像废话,但特别重要。
以前一次调用贵,大家会克制。
能不用就不用。
能少传上下文就少传。
能用规则解决,就别上模型。
现在模型降价了,很多团队第一反应是,那就全接上吧。
客服接上。
销售接上。
运营接上。
BI 接上。
文档接上。
代码接上。
会议纪要接上。
一切都接上。
看起来每次调用都便宜。
但调用次数会暴涨。
上下文会变长。
Agent 会开始互相调用。
一个任务里可能有计划、检索、生成、校验、重写、再校验。
单价降了一半。
使用量涨了十倍。
账单还是会涨。
这就是所有便宜技术的宿命。
当某个东西足够便宜,人类会发明更多使用它的方法。
电便宜以后,我们没有只是把蜡烛换成电灯。
我们发明了电梯、冰箱、空调、电视、电脑、手机、数据中心。
算力便宜以后,也不会只是把搜索框换成聊天框。
我们会把 AI 塞进每一个流程。
然后突然发现,原来便宜本身也会制造新的消费。
这就是为什么我觉得 DeepSeek 降价这类新闻,当然值得高兴。
但它不代表解决了 AI 成本问题。
它只是把问题往下一层推。
模型单价便宜以后,真正的竞争会变成,谁能用更少的上下文完成任务。
谁能让 Agent 少走弯路。
谁能把企业知识整理得更干净。
谁能减少人工审核。
谁能把错误率压到业务能接受。
谁能让同样一块显卡服务更多用户。
谁能让 AI 真的省掉流程,而不是制造新流程。
这才是下一阶段的成本战争。
它没有 API 降价那么好传播。
但更接近真实世界。
还有一个更现实的东西。
当公司说 AI 太贵的时候,它有时候说的不是钱。
它说的是不确定性。
老板最怕的不是贵。
贵,只要回报清楚,就能批预算。
真正麻烦的是,你花了钱,不知道到底省了什么。
效率提升有没有进入财报。
员工是不是只是把省下来的时间拿去开更多会。
客户满意度有没有变好。
错误率有没有下降。
销售额有没有增加。
如果这些指标说不清,AI 再便宜也显得贵。
这就是很多企业 AI 项目最难受的地方。
大家都知道要上。
不上显得落后。
但上了以后,到底怎么算 ROI?
很难。
一个部门说省了 30% 时间。
财务问,人少了吗?
收入涨了吗?
成本降了吗?
客户更满意了吗?
如果答案都很模糊,那 30% 时间就像空气。
听起来很好。
抓不住。
所以 AI 成本问题,说到底也是管理问题。
糟了。
我又用了一个很像写报告的词。
换个说法。
AI 贵不贵,关键要看公司有没有能力把它用明白。
会用的公司,AI 是杠杆。
不会用的公司,AI 是新玩具、新预算、新会议。
同样的模型,同样的价格,结果可能完全不同。
这就像健身房。
年卡打折不代表你会变瘦。
器械更便宜不代表你有训练计划。
你买了手环、蛋白粉、运动鞋、私教课,练了一圈发现最贵的不是装备。
最贵的是坚持正确动作。
公司用 AI 也一样。
模型是器械。
流程是动作。
数据是饮食。
管理是坚持。
只买器械,很容易变成昂贵摆设。
这也是为什么我觉得,普通人看 AI 成本,其实不用被那些超大数字吓到。
什么 4 万亿美元。
什么 9.6 万 token。
什么模型折扣 75%。
这些数字都重要,但别被数字带着跑。
你可以记住一个更简单的判断。
AI 真正便宜的时候,不是调用价格降下来的时候。
是它帮你完成一件事的总成本降下来的时候。
这件事可以是写一份报告。
可以是处理一个客户。
可以是发现一个漏洞。
可以是生成一个广告素材。
可以是帮一个医生少看十分钟无效信息。
可以是让一个小团队做出以前大团队才能做的东西。
只要总成本真的下降,AI 就便宜。
如果只是模型调用便宜,人还要花更多时间检查、返工、解释、擦屁股,那它就贵。
很朴素。
但也很残酷。
所以我现在越来越不喜欢那种一句话判断。
AI 会让所有东西免费。
AI 会让所有公司裁员。
AI 会让所有效率暴涨。
这些话现在听起来就很不爽。
有的地方,AI 会便宜得离谱。
比如个人写稿、查资料、做草稿、生成初版 PPT。
有的地方,AI 会贵得吓人。
比如高风险决策、复杂企业系统、长期 Agent 工作流、需要强审计的业务。
有的地方,它会先变贵,再慢慢变便宜。
因为前期要改系统、补数据、建流程、训练团队。
等这些沉没成本花完,后面才开始显出效率。
如果你是普通用户,今天的 AI 肯定比两年前便宜太多。
如果你是创业者,今天用 AI 做产品也比以前容易太多。
如果你是大公司 CIO,要把 AI 接进几百个系统、几万名员工、几十个国家地区的合规框架里,你可能真的会觉得,这玩意怎么这么贵。
三个人都没错。
他们看到的是三张不同的账单。
我觉得接下来一年,AI 行业会越来越多地从「模型能力竞赛」进入「成本结构竞赛」。
谁更便宜,当然重要。
但更重要的是,谁能让用户少走弯路。
谁能把总成本讲清楚。
谁能让企业少开会。
谁能让 Agent 少读废话。
谁能让业务少返工。
谁能让人类少擦屁股。
因为公司到头来不为聪明买单。
公司为结果买单。
而结果,从来都是一整条账本。
所以回到标题那个问题。
AI 不是已经很便宜了吗,为什么公司还说用不起?
我的答案是,便宜是真的。
用不起也是真的。
便宜的是模型的一部分价格。
贵的是把 AI 变成稳定生产力的那整套系统。
AI 会继续降价。
这几乎没什么悬念。
但真正决定它能不能普及的,可能不是下一次 API 再降 30%。
关键在于,我们能不能把那些隐藏成本,一点点降下来。
降到普通公司也能用。
降到普通员工也敢用。
降到它从一个聪明的对话框,变成一种可靠的生产方式。
那时候,AI 才是真的便宜了。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
谢谢你看我的文章,我们,下次再见。
/ 作者,生龙 Cruise
/ 投稿或爆料,请联系邮箱,Cruisewu@qq.com
资料来源
DeepSeek,DeepSeek-V4-Pro 永久降价公告https://x.com/deepseek_ai/status/2057854261699195173
Bloomberg,经 Hacker News 热门聚合,DeepSeek 将对旗舰 AI 模型实施永久性 75% 折扣https://www.bloomberg.com/news/articles/2026-05-23/deepseek-to-make-permanent-75-discount-on-flagship-ai-model
Fortune,经 Hacker News 热门聚合,微软称部分场景使用 AI 的成本高于支付人工工资https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tokens-agents
SemiAnalysis,智能体工作负载悄然重塑推理经济https://x.com/SemiAnalysis_/status/2057869518295249373
IT之家,黄仁勋称 AI 基建年度开支要冲到 4 万亿美元https://www.ithome.com/0/954/223.htm
Rohan Paul,加州为 AI 可能带来的劳动力市场冲击做准备https://x.com/rohanpaul_ai/status/2057555054387949848
夜雨聆风