OpenClaw与爱马仕都是过去时了,你的AI Agent还在乱花钱、瞎操作?这个能记事儿、懂预算、先问再做的Mercury Agent杀疯了

出品：养个闲人有限公司

当下几乎所有AI Agent用户的集体噩梦:它们能读文件、能跑命令、能抓网页，而且大多数时候都是静默操作，从不请示。

但今天这个新项目，可能要彻底终结这种恐慌。它叫Mercury Agent，一个带着”灵魂”、守着预算、并且坚持”先请示再动手”的AI Agent。目前稳定版v1.1.6，自带31个内置工具，支持7×24小时后台运行，还能通过Telegram远程操控。

为什么你的Agent需要一把”权限锁”

Mercury最颠覆性的设计，是它的Permission-hardened（权限加固）体系。它不像其他Agent那样拿到工具就无脑用，而是给你配了一把实打实的安全锁。

“Every AI agent can read files, run commands, and fetch URLs. Most do it silently. Mercury asks first — and remembers what matters.”

具体有多硬？首先，Shell命令有黑名单。sudo、rm -rf /这类高危操作永远不会自动执行。其次，文件读写有文件夹级别的作用域限制，超界必须申请。每次会话开始前，Mercury都会让你选权限模式：是”Ask Me（每件都问）”还是”Allow All（全放权）”。

更狠的是，它还有个Pending approval flow（待审批流）。哪怕你选了放权，遇到敏感操作它依然可以先卡住，等你点过头再继续。对开发者来说，这相当于给AI上了个”代码审查”机制，只不过审查对象是它自己。

Second Brain：它真的记得你说过什么

用过ChatGPT的人都知道，上下文窗口再长，换个会话就失忆。Mercury直接内置了一个SQLite-backed Second Brain（第二大脑），用本地数据库加FTS5全文检索，真正把记忆存在了你的硬盘里，而不是云端的某个黑盒中。

这套记忆系统细到让人发指。它定义了10种记忆类型：identity（身份）、preference（偏好）、goal（目标）、project（项目）、habit（习惯）、decision（决策）、constraint（约束）、relationship（关系）、episode（事件）、reflection（反思）。

每次聊完天，Mercury会自动提取0到3个事实，打上置信度、重要度和持久度标签。发新消息前，它会从库里召回最相关的5条记忆（控制在900字符以内）注入上下文。每60分钟，它还会自动做一次记忆整合：生成用户画像摘要、活跃状态摘要，甚至基于模式生成反思。

如果两条记忆冲突怎么办？高置信度的胜出；置信度一样，新的胜出。太久不活跃的记忆会自动衰减，低置信度的持久记忆在120天后被清理。所有数据都存在~/.mercury/memory/second-brain/second-brain.db，没有云，没有泄露焦虑。

Token预算管控：AI再也不敢乱烧钱

开发者最怕什么？怕Agent半夜疯狂调用GPT-4，第二天API账单比房租还贵。Mercury直接给你上了Daily Token Budget（每日Token预算）硬限制。

当日用量超过70%，Mercury会自动切换为精简模式，用最少的Token完成对话。你可以随时用/budget查看剩余额度，用/budget override临时放行单次请求，或者用/budget set重新设定日限额。

这种设计直接解决了生产环境部署AI Agent的最大痛点：成本可控。你可以放心把它挂在服务器上跑7×24，不用担心它半夜抽风烧光你的额度。

一行命令，7×24小时守护

Mercury的Daemon模式可能是目前最丝滑的Agent后台化方案。只需要一行命令：

mercury up

这行命令会自动安装系统服务（macOS用LaunchAgent、Linux用systemd用户单元、Windows用Task Scheduler），启动后台守护进程，并确保崩溃后自动恢复。它支持指数退避重启，每分钟最多尝试10次，直到服务恢复。

一旦进入Daemon模式，Telegram就成了你的主要交互渠道。你可以在地铁上、床上、咖啡厅里，用手机给Mercury派活。它支持多用户访问，有Admin和Member角色分级，还支持文件上传、流式输出、打字指示器，甚至能通过Cron表达式设置定时任务。

灵魂自定义：你的Agent不该长一个样

市面上大多数AI Agent的人格都是厂商写死的，Mercury却把它完全交给你。通过在~/.mercury/soul/目录下放几个Markdown文件，你就能定义Agent的灵魂。

soul.md管核心灵魂，persona.md管对外人格，taste.md管审美偏好，heartbeat.md管主动行为节奏。没有corporate wrapper（企业包装层），你的Agent可以毒舌、可以温柔、可以极简、可以话痨，完全由你说了算。

六家大模型兜底，挂了自动换

Mercury原生支持6类Provider，并且会自动回退。默认优先DeepSeek（成本低），如果挂了，依次尝试OpenAI、Anthropic、Grok、Ollama Cloud，最后还能落到本地Ollama。它会记住上次成功的Provider，下次优先从这里开始。

支持的模型包括DeepSeek-V3、GPT-4o-mini与GPT-4o、Claude Sonnet与Haiku与Opus、Grok-4，以及Ollama的本地和远程部署。Google Gemini和Mistral也已经在路上了。

三分钟上手，现在就能跑

安装只需要npx，零配置开箱：

npx @cosmicstack/mercury-agent

或者全局安装：

npm i -g @cosmicstack/mercury-agent
mercury

首次启动会进入向导，设置名字、模型Provider、可选的Telegram Bot。完成后，Mercury会打开Ink TUI界面，让你先选权限模式，然后才能开始对话。

常用命令对照表：

mercury up：安装服务加启动守护进程（最推荐）
mercury doctor：重新配置（换Key、改名、改设置）
mercury status：查看配置和Daemon状态
mercury logs：查看后台日志
mercury upgrade：一键升级到最新版

对话中的快捷指令也不耗Token：/tools看工具、/skills看技能、/memory管记忆、/tasks看定时任务。甚至还能用/code agent把编码任务丢给子Agent在后台跑。

Mercury Agent的出现，标志着一个新趋势：AI Agent正在从”炫技玩具”变成”可托付的生产力工具”。权限加固让你敢用，记忆系统让你省心，Token预算让你敢挂后台，Daemon模式让你随时在线。

对于打工人来说，它是不会越权的数字实习生；对于独立开发者来说，它是7×24待命的运维加编程搭档；对于创业者来说，它是成本可控、可私有化部署的智能基座。

“This is AI – it can break sometimes, please use this at your own risk.”

项目完全开源（MIT协议），目前v1.1.6稳定版，已经在GitHub上快速攀升。如果你也受够了AI Agent的”先斩后奏”和”金鱼记忆”，不妨今天就试试Mercury。毕竟，能让开发者放心睡个好觉的工具，本身就值一个Star。

#AI
#人工智能
 #OpenClaw
#技能