乐于分享
好东西不私藏

豆包收费后,我用开源方案搭了一个免费联网AI助手

豆包收费后,我用开源方案搭了一个免费联网AI助手

事情是这样的。

上周打开豆包,弹出了一个付费提示。免费版开始限制联网搜索次数,高级版一个月几十块。我也能理解,毕竟服务器要钱,模型推理要钱,团队要发工资。

但问题是,我本来就是把它当搜索用的啊。

问个实时天气要联网,查个新闻要联网,看股价要联网,三下两下,免费额度就烧完了。充钱吧,总觉得不值,不充吧,又确实需要。

然后我在 GitHub 上找到了一个叫 Hermes Agent 的开源项目,配合 Ollama 本地模型,搭了一套我自己的联网AI助手。跑了三天,体验出乎意料的好。

今天就把这套方案摊开来说。

你需要的就两样东西

Ollama,运行本地模型的引擎

Ollama 这东西,就是一个让你在本地跑大模型的工具箱。

安装就一行命令:

curl -fsSL https://ollama.com/install.sh | sh

然后拉一个模型。我本地用的 qwen2.5:7b,7B 参数对联网搜索这种任务完全够用,不需要上 70B 的大模型。如果你显存够大,也可以上 llama3.1:8b 或 qwen2.5:14b。

ollama pull qwen2.5:7b

Hermes Agent,开源的AI代理框架

Hermes Agent 是 Nous Research 做的一个开源项目。普通的 ChatGPT 你问一句它答一句,但 Hermes 不一样,它能调用工具。

我说得直白点,Hermes 有一个工具系统。

你告诉它「帮我查一下今天沪深300的表现」,它会先调联网搜索拿到数据,然后自己读结果,再总结给你。它不需要你手动复制粘贴。

安装:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

然后配置用 Ollama:

hermes config set model.provider ollama
hermes config set model.default qwen2.5:7b

联网功能怎么开

Hermes 默认的联网是关的,得自己打开。

hermes tools enable web

就这一行命令。然后重启会话,Hermes 就有了联网搜索和网页内容提取的能力。

你试试问它「最近一周AI行业有什么大事」,它会自动调用 web_search 搜索关键词,点开结果页面提取关键信息,然后整理成回答。

全程不需要你切窗口,不需要你复制粘贴,不需要你手动打开浏览器。

配置就这些。花五分钟,装完就能用。

几款联网功能 Skill 的对比

Hermes 生态里,除了内置的 web 搜索工具,还有几个专门覆盖不同联网场景的技能。我把能用的一一列一下。

1. 内置联网搜索(web toolset)

定位:默认装在 Hermes 里的搜索工具。能力:搜索 + 提取网页内容 + 自动阅读。

优点

  • 零安装零配置,一行命令启用

  • 搜索和内容提取一体,不需要切工具

  • 自带 Playwright 浏览器引擎,反爬能力不错

  • 支持中国大陆网络环境的代理配置

缺点

  • 搜索质量依赖底层搜索引擎

  • 不支持定时轮询和离线缓存

  • 每次实时搜

结论:最推荐大多数人用的方案。零门槛零成本。

2. web-scraping Skill

定位:给需要定向抓取特定网站内容的人用。能力:支持 Scrapling、Curl_cffi、CamoFox、Playwright 等多种爬虫工具。

优点

  • 全家桶方案,从简单到复杂的爬取一个skill全包

  • 针对淘宝/1688 等强反爬平台有专门的方案文档

  • 自带 Jina Reader 快捷方式(r.jina.ai/URL),单页面提取非常快

  • 支持 site-patterns 机制,爬过的平台不需要重复踩坑

  • 有可复用的模板脚本

缺点

  • 学习曲线陡,8种工具每种都有自己的安装和使用方式

  • CamoFox 需要 Node.js 编译环境,在 WSL 上很难装

  • 淘宝/1688 等平台最终还是建议走官方 API

  • 对只是想简单搜个东西的用户来说太重了

结论:适合有定向采集需求的开发者。偶尔搜新闻不如用内置搜索。

3. blogwatcher Skill

定位:持续追踪特定博客和 RSS 源的更新。能力:添加 RSS 源,自动扫描新文章,管理已读未读。

优点

  • 不需要主动搜索,自动推新内容

  • 支持 RSS 自动发现和 HTML 回退抓取

  • 支持 OPML 批量导入,一次加入几十个博客

  • 配合 cron 任务可以实现每日自动汇总

缺点

  • 需要安装额外的二进制工具 blogwatcher-cli

  • 不会帮你总结文章,只告诉你「有更新」

  • 只适用于有 RSS 的博客,不能搜索全网

  • 小众维护项目,更新频率不高

结论:适合有固定阅读习惯的人做信息聚合。不适合临时的搜索需求。

4. youtube-content Skill

定位:获取 YouTube 视频的文字内容。能力:下载字幕,生成摘要、章节、推文、博客文章。

优点

  • 把视频变成可搜索的文字,解决视频太长不想看的问题

  • 支持多种输出格式:摘要、章节划分、推文串、博客文章

  • 配合联网搜索,先搜到相关视频再自动提取内容

缺点

  • 只支持有字幕的视频

  • 需要安装 youtube-transcript-api 库

  • 依赖国内能否正常访问 YouTube

  • 没有搜索能力,只是内容处理工具

结论:视频创作者的实用工具,但需要配合其他搜索工具使用。

怎么选

我自己的配置是这样的:日常查资料搜新闻,用内置 web 工具集就够了。需要追踪特定博客的更新,加一个 blogwatcher 配合 cron 定时任务。看过的好视频想做笔记,用 youtube-content。

如果你只是为了替代豆包的联网搜索,只开内置 web 工具集就行

省了多少钱

算一下账。豆包高级会员一年几百块。Ollama 加 Hermes 是零成本。唯一的花费是电费。

你可能会说,用本地模型不是不如豆包聪明吗?

坦率讲,确实不如。7B 本地模型在理解复杂指令和长上下文方面,比不上云端的大模型。但你要想清楚你的需求,你是要一个能帮你搜东西的助手,还是要一个能写诗的诗人?

联网搜索这个场景,核心不在模型有多聪明,而在于它知不知道什么时候该去搜索,怎么搜,搜回来能不能读。这三件事,本地模型配合 Hermes 的工具调用做得很好。

而且还有一个很爽的点:没有敏感词过滤,没有内容审核,没有任何限制。模型是跑在你自己的电脑上的,你能搜什么用什么,完全自己说了算。

末了

说真的,我写这篇文章不是想吹哪个工具多好。

我最大的感受是,现在的开源生态已经把门槛降到很低了。一年前如果你想搞一个本地模型加联网搜索,你得自己写中间件,处理工具调用,处理上下文管理。现在 Hermes 把这些全打包了,你装完就能用。

豆包收费可能只是开始。以后越来越多的AI服务会走向收费,这是不可逆的趋势。早一点接触开源方案,不是坏事。

至少下次弹窗出来的那一刻,你心里有底。