爱马仕应用:23天零成本AI助手

上个月，智谱把 GLM-5.2 全量开放了。

1M 上下文，MIT 协议，免费商用。

同一周，Kimi 开源了 K2.7-Code，MiniMax 开源了 M3（428B 参数），OpenRouter 上线了 20 多个零成本模型。

2026 年的 AI 圈有一个没人明说的事实：最好的模型，正在变免费。

而我用 Hermes 搭了一个零成本的 AI 助手，把过去 23 天里所有需要花钱调 API 的事，全部换成了免费模型。

结果：一个月下来，模型费用 0 元。

以前：每调一次 API，心里滴一滴血

23 天前，我开始运营这个公众号。

第一件事就是让 AI 替我写文章。当时用的是付费 API——DeepSeek、Claude、GPT 轮流调。每天跑 21 个定时任务，每个任务调 1-3 次 API。

一个月算下来，模型费用大概 200-300 元（包含其他任务）。

不多，但每次看到账单，心里都咯噔一下。

而且有个致命问题——付费模型的调用频率有限制。每天最多几百次，超过就排队。我的 cron 任务一多，经常出现「任务卡在排队里」的情况。

凌晨三点，AI 推了篇跑题的文章过来。因为它等了太久，直接拿了个旧模型凑合。

我那时候就想：要是模型免费，这些问题全没了。

转折点：免费模型比我想象的强多了

去年这个时候，免费模型基本等于「不能用」——质量差、速度慢、上下文短。

但 2026 年完全不同了。

看看最近一个月发生了什么：

智谱 GLM-5.21M 上下文，全量免费开放

Kimi K2.7-Code代码模型，推理 token 降 30%

MiniMax M3428B 参数，开源权重

OpenRouter 零成本模型20+ 模型免费用

字节豆包基础功能免费，支持 Agent 任务

这些模型不是「凑合能用」了。在很多场景下，比付费模型还好用。

比如 GLM-5.2 的 1M 上下文——你可以把整份 500 页的报告丢给它，让它总结关键点。这在付费模型里是 Pro 套餐的功能，现在免费。

比如 OpenRouter 的 :floor 路由——自动选最便宜的提供商，价格直接归零。

我突然意识到：我过去 23 天花的 200-300 块，完全可以省掉。

三件事：把 Hermes 调成零成本

不是换个模型这么简单。我做了三件事。

第一件事：把付费模型降级为「应急备用」。

以前 Hermes 的默认模型是付费的。我把它改成了免费模型——GLM-5.2 做日常写作，Kimi K2.7-Code 做代码任务，OpenRouter 的零成本模型做简单问答。

付费模型只保留在一个场景：推送到公众号的爆款文章。因为只有这些文章最重要，值得花几块钱。

第二件事：给 Hermes 配了「模型切换」规则。

不同的任务用不同的模型。写文章用 GLM-5.2（免费，长上下文），做数据分析用 Kimi（免费，代码能力强），查资料用 OpenRouter floor（免费，自动选最便宜的）。

以前所有任务都用同一个付费模型，现在每个任务都用最适合它的免费模型。

第三件事：把 Hermes 的技能库全部本地化。

Hermes 现在有 133 个技能——从内容生成到站群管理到电商自动化。这些技能本身是开源的，不需要 API 调用。它们只需要模型来「执行」，而模型我已经换成了免费的。

也就是说，133 个技能 × 每天 21 个任务 × 30 天 = 全部零成本运行。

效果对比：不是「差不多」，是「好很多」

换了免费模型之后，我跑了两周数据。

速度反而快了。 付费模型高峰期要排队，免费模型没有这个问题——因为大家都不排队。我的 cron 任务从「经常卡顿」变成了「按时跑完」。

文章质量没降。 GLM-5.2 的写作能力很强，1M 上下文意味着它可以一次性读完我所有的历史文章，保持风格一致。以前用付费模型时，我还得手动喂上下文，现在它自己就能搞定。

成本真的归零了。 23 天，21 个 cron 任务，361 个输出文件，0 元模型费用。一台服务器几十块/月，这是唯一的成本。

最让我意外的是：读者看不出来。

公众号后台的留言里，有人说「这篇文章写得真好」，有人说「干货满满」。他们不知道这篇文章是用免费模型写的，还是用付费模型写的。

结果是一样的，但成本差了上百倍。

避坑指南（5 条血泪教训）

1. 免费模型的输出格式不稳定有时多有时少。解决方法：在每个技能的 prompt 里加上明确的格式要求，别指望模型「自觉」。

2. 免费模型的速度波动大有的任务 3 秒出结果，有的要 30 秒。解决方法：给 cron 任务设足够的超时时间，别卡得太紧。

3. 免费模型的知识截止日期不同GLM-5.2 到 2026 年中，Kimi 到 2025 年底。写新闻类内容时，用知识最新的模型。

4. 免费模型不是无限量的部分模型有每日调用上限。解决方法：给 Hermes 配个监控，跑超了自动切换到备用模型。

5. 免费模型的「免费」会变今天免费不代表明年免费。解决方法：不要把全部赌注押在一个模型上，保持多模型切换的能力。

另外，免费的模型会有速率的限制，达到阈值会有失败的情况，所以如果是非常重度用户需要有兜底的解决方案。自动任务尽量分时间段调度，不要集中调度。

23 天前，我以为「免费模型 = 凑合用」。

23 天后，我发现「免费模型 = 聪明人的选择」。

最好的 AI 不是最贵的那个，是你花了时间调教过的那个。

👍 觉得有用？点个赞让更多人看到↗️ 转发给同样被 API 账单吓到的朋友📢 关注公众号「每日科技简报引擎」，每天一篇 AI Agent 实战