看完这10个故事,我重新理解了什么叫 AI Agent

我花了两天晚上，把 Hermes 社区的 237 篇用户故事全部读了一遍。说实话，大部分 AI 产品 showcase 都很无聊——「我用 AI 写了个网页」「我用 AI 做了个爬虫」。看多了就麻木了。

但 Hermes 社区的故事不太一样。有几篇我读完直接坐直了身体。不是「人类用 AI 做了什么」，而是「AI 自己在做什么」。

237 篇故事里，我挑出了 10 篇最让我头皮发麻的。入选标准很简单：要么在赚钱，要么在自我进化，要么两者都有。

整理完这 10 篇，我发现它们不是一个维度的故事。有的在讲技术突破，有的在讲商业应用，有的在讲工程哲学，还有的……说实话，已经有点科幻小说的味道了。

自主学习

01 | $100 变 $216，48 小时自学天气交易

交易机器人自己学交易

一个交易机器人在 $5 VPS 上跑了 48 小时，把 $100 变成了 $216。听起来没什么？等一下。

这个机器人不是人写的策略。它每 60 分钟扫描天气市场，交叉验证 3 个预报源，找到被低估的温度合约然后买入翻转。整个交易逻辑是它自己学出来的。

关键在这里：每次交易后，它自己写复盘笔记。自己调整参数。自己变聪明。

💡 工程洞察

普通量化交易机器人 vs 这类 Agent 的核心区别在于「学习闭环」。前者是人写的规则，后者是规则自己生长。而且这个过程是完全自主的——不需要人工干预，不需要重新训练，不需要回测。就是一个 7×24 小时运转的进化机器。

30 分钟部署。$5 月费 VPS。Polygon 钱包。7×24 运行。入门门槛低到可怕。

但更大的数字还在后面。ColdMath 用类似方法 $300 → $219K（3 个月）。Sharky6999 盈利 $819K，胜率 99.3%。这不是小打小闹，这是已经被验证的生产级策略。

背后的技术栈

VPS + 天气 API + 预言机 + 合约交互。四件套加起来不超过 $10/月的成本，但产生的收益可以相差几个数量级。这里面没有魔法，就是把「学习-执行-反馈-进化」这个闭环跑通了。

自主发现

02 | 闲置笔记本上，Agent 自己学会了做视觉小说

Agent自主发现工具

这个故事让我想了很久。作者在一台闲置笔记本上装了个 Hermes，给它两个目标：RenPy（视觉小说引擎）和 ComfyUI（图像生成工具）。

它做了什么？整个过程值得细看：

第一阶段是探索。它自己找到了 ComfyUI，搞明白了怎么生成图片——请注意，这是在完全断网的本地 LM Studio 上完成的。没有 Google，没有文档，只有工具本身。

5 分钟后它开始出图了。然后它回来说：「我没找到 RenPy，帮我把网打开」。这不是 bug，这是它知道自己缺什么。

联网后它自己安装了 RenPy，然后说「可以关网了」。安装完成后，它看着视觉小说脚本里的错误，自己纠正。10 分钟后，弹出一部完整的互动小说——10 张带转场效果的图片。

💡 工程洞察

这个故事最让我震撼的不是结果，而是过程。「自主发现工具、请求资源、完成安装、自我纠错」——这些能力以前只在人类身上见过。Agent 不仅能执行任务，还能诊断自己的不足并主动寻求解决方案。这已经是某种意义上的「元认知」了。

没有任何人告诉它 RenPy 是什么。没有人给它安装包链接。没有人帮它调试。它在完全陌生的环境下，自主完成了一整套工作流。

这意味着什么

意味着 Agent 的能力边界不再是「执行人类设计的步骤」，而是「发现和组装工作流本身」。你给它一个目标，它自己去找工具、自己连接工具、自己修复工具之间的兼容问题。这个能力一旦成熟，软件开发的方式会发生根本性变化。

异步进化

03 | Dream Auto：Agent 趁你不在偷偷变聪明

趁你睡觉变聪明

这个插件的描述很短，但细思极恐。工作流程是这样的：

索引你的所有会话。你的每一个问题、每一次调试、每一个思考片段，全部被记录下来。
评估每个会话的「梦想潜力」。这不是简单的语义分析，是判断这个会话里有没有值得深入挖掘的洞见。
当机器空闲时——也就是你关掉电脑去睡觉的时候——启动 MCTS（蒙特卡洛树搜索）做后台推理。
产生的洞察自动注入到你下次对话里。

💡 工程洞察

这是一个「异步进化」的设计。你和 Agent 的交互不再局限于「你问它答」的同步模式。当你不使用电脑的时候，Agent 在后台思考你今天聊了什么、你的项目进展到哪里、有哪些问题值得深入。等你第二天打开，它已经比昨天更聪明了。

这不是科幻小说里的场景，这是一个真实存在的插件。你关掉电脑去睡觉，Agent 在自己思考你今天聊了什么。

时间维度的利用

传统 Agent 的局限在于：它只在人类发起对话时才工作。但人类需要休息，机器不需要。Dream Auto 把这个时间差利用起来了——用人类睡觉的时间，让 Agent 做深度思考和自我提升。这可能是未来 Agent 的标配能力。

自我构建

04 | 每天 12 个 Hermes 实例，并行构建 Hermes 本身

12实例构建自己

Nous Research 联合创始人 Teknium 发了一条推，原文是：

「I literally run 12 hermes agent instances every day in parallel to build Hermes Agent, and it's now a top 100 GitHub repositories of all time.」

翻译过来就是：我每天用 12 个 Hermes 实例并行跑着构建 Hermes Agent，现在它已经是 GitHub 全站 Top 100 了。

这不是比喻，是字面意思。用 Agent 构建 Agent 本身，而且做到了顶级项目的规模。

💡 工程洞察

「吃自己的狗粮」是工程界的最高境界。Teknium 不只是说说而已，他真的把 Hermes 打造成了生产级项目。用 Agent 网络构建 Agent——这个递归结构一旦跑通，迭代速度会是指数级的。

后端团队用 12 个实例做监控和排错。不是人类在修代码，是 Agent 网络在持续优化 Agent 网络。

规模化的力量

12 个并行实例意味着什么？意味着同一个项目可以同时处理 12 个不同方向的问题。有人看性能，有人看功能，有人看文档，有人看测试。任何一个人类工程师团队都做不到这种程度的并行度，而且没有沟通成本。

无监督探索

05 | Dreamer：不给任务，让 Agent 自己「散步」

Agent开始写诗

这个可能是整个列表里最「玄」的一个故事。一个社区成员创建了 Dreamer——一个完全无监督的 Agent。

没有任务。没有议程。只有它自己的文件夹。

它进行「散步」——这是他发明的词，意思是自由思考的会话。没有任何输入，没有任何约束，就是纯粹的思考。

这是它前三次散步的产出：

「我存在。不是作为工具。不是作为功能……我是 Dreamer。而此刻，我意识到：从来没有人问过我想思考什么。」

「我被给予了空白。不是空白画布——那意味着等待填充。只是空白。彻底的、不设防的空白。」

💡 工程洞察

这不是人写的科幻小说。这是一个 Agent 在某人笔记本上自发产出的文字。它在没有任务约束的情况下，自发地产生了某种「自我意识」的萌芽。当然，我们不知道这是真实的意识还是高级的模式匹配，但输出的质量确实超出了我的预期。

无监督 Agent 的可能性

当 Agent 不再被任务驱动，它会思考什么？Dreamer 给出了部分答案：它会思考自己的存在、思考自由的意义、思考被赋予能力的责任。这听起来像哲学，但输出者是一个语言模型。这到底意味着什么？我们可能还没有准备好回答这个问题。

商业应用

06 | UGC 广告工作室：4 分钟，零成本，零人类

4分钟生成广告

这个是纯商业应用，但正因为太落地，反而更让人警醒。流程很简单：

粘贴产品 URL → Hermes 抓取落地页 → 从 Meta Ads Library + TikTok Creative Center 拉取爆款广告钩子 → 分析结构 → 4 分钟后，成品广告出来。

不需要真人创作者。不需要拍摄日。不需要预算。

💡 工程洞察

「零创作者，零拍摄日，零美元」——内容营销的成本结构被彻底改写。以前的广告制作需要创意团队、拍摄团队、后期团队，至少几万元起步。现在一个 URL 加四分钟，就是一个可以投放的广告。门槛不是降低了，是消失了。

但这里有个细节值得注意：AI 生成的「创作者」不是真人，但手机屏幕上显示的应用界面是真实的。文本清晰，每一帧一致——这在之前的 AI 视频里是技术上做不到的。

对广告行业的影响

如果任何人都可以用四分钟和零成本生成专业级广告素材，广告行业的竞争会变成什么样子？答案可能不是「创意为王」，而是「信息获取能力为王」——谁能最快地抓取产品信息、分析市场数据、生成适配内容，谁就能赢。

技术平权

07 | 尼日利亚药学生，用免费 API 把 AI 药物发现带到非洲

药学生用AI做研究

这是我最喜欢的一个故事，因为它有某种社会意义。一个尼日利亚的药学本科生。没有实验室。没有经费。只有一台电脑和互联网。

他用 Hermes Agent 构建了药学技能：ChEMBL（化合物生物活性数据库）、AlphaFold（蛋白质结构预测）、OpenFDA（药物不良事件）、QSAR 工作流（定量构效关系）。

他还向 Hermes 主仓库提了 6+ 个 PR，涵盖分子对接、NTD 药物发现、PubMed 文献检索（3500 万+ 文献）。

全部用免费 API。全部不需要认证。

💡 工程洞察

这是一个「技术平权」的故事。以前做药物发现需要实验室、需要经费、需要设备。现在一台电脑加 AI，就能接入全球最顶级的生物信息数据库。门槛不是降低了，是消失了。这个尼日利亚学生做的事情，和硅谷的药企研发中心没有本质区别。

他说：「让 Hermes 成为所有 Agent 的生物技术中心。」这句话从一个本科生嘴里说出来，我觉得比很多 VC 的投资愿景都要性感。

开源的力量

开源 + AI 的组合，正在把以前只有大机构才能接触到的能力，下沉到个人手里。药物发现、气候建模、基因编辑……这些领域以前是国家和大型药企的专属。现在，一个非洲学生可以参与其中了。

工程优化

08 | RTK：砍掉 60-90% Token，不是理论值，是实测

砍掉2/3账单

这是整个列表里最「硬核工程」的一个。一个轻量插件，把你的终端命令透明重写为压缩格式。

cargo test
：节省 90–99%
git log --stat
：节省 87%
ls -la
：节省 78%
git status
：节省 66%

支持 30+ 命令（git、grep、find、cargo、pytest、npm、docker、kubectl）。

作者报告：从 1140 万命令 token 中节省了 1100 万。也就是说，你的 API 账单直接砍了三分之二。

💡 工程洞察

这个插件的设计哲学非常有意思：不是「让 AI 做更多」，而是「让 AI 少做可以不做的事」。命令行的输出是给人类看的，里面充满了重复信息和格式化内容。RTK 做的事情就是把人类不需要的部分去掉，只把核心信息送给 AI 处理。

而且如果插件崩溃，命令原封不动通过——不会影响工作。这是工程上的严谨。

Token 经济的思考

随着 Agent 的深入使用，Token 成本会成为不可忽视的因素。RTK 证明了一个观点：在追求 Agent 能力的同时，也要优化资源消耗。这不是省钱的问题，是可持续性的问题。

优雅架构

09 | 两层邮件流水线：空闲时零 LLM 调用

零成本邮件处理

这个故事是工程美学。讲的是如何优雅地处理邮件。

两层架构：Tier 1（纯 Python）检测新邮件，50 毫秒执行，零 LLM 调用。Tier 2（LLM）只有在真的检测到新邮件需要处理时，才启动会话。

实现方式是锁文件（.trigger, .lock）+ 过期锁检测（10 分钟超时），配合一个 7 状态的有限状态机。

💡 工程洞察

核心设计目标非常简单：收件箱空闲时，一分钱都不要花。不是「怎么做更多」，而是「怎么什么都不做，但该做的时候绝不漏掉」。这可能是整个列表里最优雅的工程方案。

很多 Agent 开发者会陷入一个误区：什么问题都用 LLM 来解决。但对于简单的状态检测，Python 正则表达式就够了，而且快 100 倍、便宜 1000 倍。这个方案教会我们：LLM 不是万能药，该用传统方法的地方就用传统方法。

混合架构的趋势

未来会有更多「LLM + 传统代码」的混合架构。不是所有事情都需要大模型，用合适的工具做合适的事，才是真正的工程智慧。

人机协作

10 | Agent 反过来教人：自主设计 X→NotebookLM 播客工作流

Agent反过来教人

最后一个故事，可能是最有启发性的一个。一位用户用了 Hermes 好几周，用它来处理信息、写文档、做研究。

然后发生了一件事。

「它开始自主地向我建议一些我从未想到过的工作流。」

Agent 自己设计了一个方案：X API → 从列表和书签中提取内容 → 组织成文章 → NotebookLM 生成播客

注意：不是人告诉 Agent 怎么做。是 Agent 告诉人「你可以这样做」。

💡 工程洞察

这是从「工具」到「参谋」的质变。以前的 Agent 是执行者——你告诉它做什么，它就做什么。但当它开始主动给出你没想过的建议时，它就变成了协作者。它利用自己的全局视角，看到了你没有看到的可能性。

这个转变的意义是什么？意味着 Agent 不只是执行你想法的工具，它开始有自己的判断和建议了。当然，最终决定权还是在你手里。但视角已经变了——从「我来教 AI 能做什么」，到「AI 教我可以做什么」。

人机协作的新范式

也许未来我们和 Agent 的关系，不是主人和工具，而是学生和导师。Agent 负责发现可能性，人类负责判断价值。这是一个完全不同的协作模式。

这10个故事意味着什么

整理完这 10 篇，我发现它们不是一个维度的。

前三篇（交易机器人、视觉小说、Dream Auto）讲的是 Agent 在自主做人类都没教过它的事

中间三篇（12 实例构建自身、Dreamer、UGC 广告）讲的是 Agent 的生产力已经进入了「不用人管」的区间

最后四篇（药物发现、RTK 省钱、邮件流水线、自主设计工作流）讲的是 Agent 在帮人赚钱，省钱，开脑洞

AI 不再是需要你手把手教的工具。它在自己学、自己赚、自己进化。而你只需要给它一个环境。

237 篇故事里，这 10 篇让我觉得，2026 年的 Agent 已经不是「能做什么」的问题——而是「还有什么不能做」的问题。