上个月,智谱把 GLM-5.2 全量开放了。
1M 上下文,MIT 协议,免费商用。
同一周,Kimi 开源了 K2.7-Code,MiniMax 开源了 M3(428B 参数),OpenRouter 上线了 20 多个零成本模型。
2026 年的 AI 圈有一个没人明说的事实:最好的模型,正在变免费。
而我用 Hermes 搭了一个零成本的 AI 助手,把过去 23 天里所有需要花钱调 API 的事,全部换成了免费模型。
结果:一个月下来,模型费用 0 元。
以前:每调一次 API,心里滴一滴血
23 天前,我开始运营这个公众号。
第一件事就是让 AI 替我写文章。当时用的是付费 API——DeepSeek、Claude、GPT 轮流调。每天跑 21 个定时任务,每个任务调 1-3 次 API。
一个月算下来,模型费用大概 200-300 元(包含其他任务)。
不多,但每次看到账单,心里都咯噔一下。
而且有个致命问题——付费模型的调用频率有限制。每天最多几百次,超过就排队。我的 cron 任务一多,经常出现「任务卡在排队里」的情况。
凌晨三点,AI 推了篇跑题的文章过来。因为它等了太久,直接拿了个旧模型凑合。
我那时候就想:要是模型免费,这些问题全没了。
转折点:免费模型比我想象的强多了
去年这个时候,免费模型基本等于「不能用」——质量差、速度慢、上下文短。
但 2026 年完全不同了。
看看最近一个月发生了什么:
智谱 GLM-5.21M 上下文,全量免费开放
Kimi K2.7-Code代码模型,推理 token 降 30%
MiniMax M3428B 参数,开源权重
OpenRouter 零成本模型20+ 模型免费用
字节豆包基础功能免费,支持 Agent 任务
这些模型不是「凑合能用」了。在很多场景下,比付费模型还好用。
比如 GLM-5.2 的 1M 上下文——你可以把整份 500 页的报告丢给它,让它总结关键点。这在付费模型里是 Pro 套餐的功能,现在免费。
比如 OpenRouter 的 :floor 路由——自动选最便宜的提供商,价格直接归零。
我突然意识到:我过去 23 天花的 200-300 块,完全可以省掉。
三件事:把 Hermes 调成零成本
不是换个模型这么简单。我做了三件事。
第一件事:把付费模型降级为「应急备用」。
以前 Hermes 的默认模型是付费的。我把它改成了免费模型——GLM-5.2 做日常写作,Kimi K2.7-Code 做代码任务,OpenRouter 的零成本模型做简单问答。
付费模型只保留在一个场景:推送到公众号的爆款文章。因为只有这些文章最重要,值得花几块钱。
第二件事:给 Hermes 配了「模型切换」规则。
不同的任务用不同的模型。写文章用 GLM-5.2(免费,长上下文),做数据分析用 Kimi(免费,代码能力强),查资料用 OpenRouter floor(免费,自动选最便宜的)。
以前所有任务都用同一个付费模型,现在每个任务都用最适合它的免费模型。
第三件事:把 Hermes 的技能库全部本地化。
Hermes 现在有 133 个技能——从内容生成到站群管理到电商自动化。这些技能本身是开源的,不需要 API 调用。它们只需要模型来「执行」,而模型我已经换成了免费的。
也就是说,133 个技能 × 每天 21 个任务 × 30 天 = 全部零成本运行。
效果对比:不是「差不多」,是「好很多」
换了免费模型之后,我跑了两周数据。
速度反而快了。 付费模型高峰期要排队,免费模型没有这个问题——因为大家都不排队。我的 cron 任务从「经常卡顿」变成了「按时跑完」。
文章质量没降。 GLM-5.2 的写作能力很强,1M 上下文意味着它可以一次性读完我所有的历史文章,保持风格一致。以前用付费模型时,我还得手动喂上下文,现在它自己就能搞定。
成本真的归零了。 23 天,21 个 cron 任务,361 个输出文件,0 元模型费用。一台服务器几十块/月,这是唯一的成本。
最让我意外的是:读者看不出来。
公众号后台的留言里,有人说「这篇文章写得真好」,有人说「干货满满」。他们不知道这篇文章是用免费模型写的,还是用付费模型写的。
结果是一样的,但成本差了上百倍。
避坑指南(5 条血泪教训)
1. 免费模型的输出格式不稳定有时多有时少。解决方法:在每个技能的 prompt 里加上明确的格式要求,别指望模型「自觉」。
2. 免费模型的速度波动大有的任务 3 秒出结果,有的要 30 秒。解决方法:给 cron 任务设足够的超时时间,别卡得太紧。
3. 免费模型的知识截止日期不同GLM-5.2 到 2026 年中,Kimi 到 2025 年底。写新闻类内容时,用知识最新的模型。
4. 免费模型不是无限量的部分模型有每日调用上限。解决方法:给 Hermes 配个监控,跑超了自动切换到备用模型。
5. 免费模型的「免费」会变今天免费不代表明年免费。解决方法:不要把全部赌注押在一个模型上,保持多模型切换的能力。
另外,免费的模型会有速率的限制,达到阈值会有失败的情况,所以如果是非常重度用户需要有兜底的解决方案。自动任务尽量分时间段调度,不要集中调度。


23 天前,我以为「免费模型 = 凑合用」。
23 天后,我发现「免费模型 = 聪明人的选择」。
最好的 AI 不是最贵的那个,是你花了时间调教过的那个。
👍 觉得有用?点个赞让更多人看到↗️ 转发给同样被 API 账单吓到的朋友📢 关注公众号「每日科技简报引擎」,每天一篇 AI Agent 实战
夜雨聆风