OpenClaw与爱马仕都是过去时了,你的AI Agent还在乱花钱、瞎操作?这个能记事儿、懂预算、先问再做的Mercury Agent杀疯了
出品:养个闲人有限公司
当下几乎所有AI Agent用户的集体噩梦:它们能读文件、能跑命令、能抓网页,而且大多数时候都是静默操作,从不请示。

但今天这个新项目,可能要彻底终结这种恐慌。它叫Mercury Agent,一个带着”灵魂”、守着预算、并且坚持”先请示再动手”的AI Agent。目前稳定版v1.1.6,自带31个内置工具,支持7×24小时后台运行,还能通过Telegram远程操控。
为什么你的Agent需要一把”权限锁”
Mercury最颠覆性的设计,是它的Permission-hardened(权限加固)体系。它不像其他Agent那样拿到工具就无脑用,而是给你配了一把实打实的安全锁。
“Every AI agent can read files, run commands, and fetch URLs. Most do it silently. Mercury asks first — and remembers what matters.”
具体有多硬?首先,Shell命令有黑名单。sudo、rm -rf /这类高危操作永远不会自动执行。其次,文件读写有文件夹级别的作用域限制,超界必须申请。每次会话开始前,Mercury都会让你选权限模式:是”Ask Me(每件都问)”还是”Allow All(全放权)”。
更狠的是,它还有个Pending approval flow(待审批流)。哪怕你选了放权,遇到敏感操作它依然可以先卡住,等你点过头再继续。对开发者来说,这相当于给AI上了个”代码审查”机制,只不过审查对象是它自己。
Second Brain:它真的记得你说过什么
用过ChatGPT的人都知道,上下文窗口再长,换个会话就失忆。Mercury直接内置了一个SQLite-backed Second Brain(第二大脑),用本地数据库加FTS5全文检索,真正把记忆存在了你的硬盘里,而不是云端的某个黑盒中。
这套记忆系统细到让人发指。它定义了10种记忆类型:identity(身份)、preference(偏好)、goal(目标)、project(项目)、habit(习惯)、decision(决策)、constraint(约束)、relationship(关系)、episode(事件)、reflection(反思)。
每次聊完天,Mercury会自动提取0到3个事实,打上置信度、重要度和持久度标签。发新消息前,它会从库里召回最相关的5条记忆(控制在900字符以内)注入上下文。每60分钟,它还会自动做一次记忆整合:生成用户画像摘要、活跃状态摘要,甚至基于模式生成反思。
如果两条记忆冲突怎么办?高置信度的胜出;置信度一样,新的胜出。太久不活跃的记忆会自动衰减,低置信度的持久记忆在120天后被清理。所有数据都存在~/.mercury/memory/second-brain/second-brain.db,没有云,没有泄露焦虑。
Token预算管控:AI再也不敢乱烧钱
开发者最怕什么?怕Agent半夜疯狂调用GPT-4,第二天API账单比房租还贵。Mercury直接给你上了Daily Token Budget(每日Token预算)硬限制。
当日用量超过70%,Mercury会自动切换为精简模式,用最少的Token完成对话。你可以随时用/budget查看剩余额度,用/budget override临时放行单次请求,或者用/budget set重新设定日限额。
这种设计直接解决了生产环境部署AI Agent的最大痛点:成本可控。你可以放心把它挂在服务器上跑7×24,不用担心它半夜抽风烧光你的额度。
一行命令,7×24小时守护
Mercury的Daemon模式可能是目前最丝滑的Agent后台化方案。只需要一行命令:
mercury up
这行命令会自动安装系统服务(macOS用LaunchAgent、Linux用systemd用户单元、Windows用Task Scheduler),启动后台守护进程,并确保崩溃后自动恢复。它支持指数退避重启,每分钟最多尝试10次,直到服务恢复。
一旦进入Daemon模式,Telegram就成了你的主要交互渠道。你可以在地铁上、床上、咖啡厅里,用手机给Mercury派活。它支持多用户访问,有Admin和Member角色分级,还支持文件上传、流式输出、打字指示器,甚至能通过Cron表达式设置定时任务。

灵魂自定义:你的Agent不该长一个样
市面上大多数AI Agent的人格都是厂商写死的,Mercury却把它完全交给你。通过在~/.mercury/soul/目录下放几个Markdown文件,你就能定义Agent的灵魂。
soul.md管核心灵魂,persona.md管对外人格,taste.md管审美偏好,heartbeat.md管主动行为节奏。没有corporate wrapper(企业包装层),你的Agent可以毒舌、可以温柔、可以极简、可以话痨,完全由你说了算。
六家大模型兜底,挂了自动换
Mercury原生支持6类Provider,并且会自动回退。默认优先DeepSeek(成本低),如果挂了,依次尝试OpenAI、Anthropic、Grok、Ollama Cloud,最后还能落到本地Ollama。它会记住上次成功的Provider,下次优先从这里开始。
支持的模型包括DeepSeek-V3、GPT-4o-mini与GPT-4o、Claude Sonnet与Haiku与Opus、Grok-4,以及Ollama的本地和远程部署。Google Gemini和Mistral也已经在路上了。
三分钟上手,现在就能跑
安装只需要npx,零配置开箱:
npx @cosmicstack/mercury-agent
或者全局安装:
npm i -g @cosmicstack/mercury-agent
mercury
首次启动会进入向导,设置名字、模型Provider、可选的Telegram Bot。完成后,Mercury会打开Ink TUI界面,让你先选权限模式,然后才能开始对话。
常用命令对照表:
mercury up:安装服务加启动守护进程(最推荐)
mercury doctor:重新配置(换Key、改名、改设置)
mercury status:查看配置和Daemon状态
mercury logs:查看后台日志
mercury upgrade:一键升级到最新版
对话中的快捷指令也不耗Token:/tools看工具、/skills看技能、/memory管记忆、/tasks看定时任务。甚至还能用/code agent把编码任务丢给子Agent在后台跑。
Mercury Agent的出现,标志着一个新趋势:AI Agent正在从”炫技玩具”变成”可托付的生产力工具”。权限加固让你敢用,记忆系统让你省心,Token预算让你敢挂后台,Daemon模式让你随时在线。
对于打工人来说,它是不会越权的数字实习生;对于独立开发者来说,它是7×24待命的运维加编程搭档;对于创业者来说,它是成本可控、可私有化部署的智能基座。
“This is AI – it can break sometimes, please use this at your own risk.”
项目完全开源(MIT协议),目前v1.1.6稳定版,已经在GitHub上快速攀升。如果你也受够了AI Agent的”先斩后奏”和”金鱼记忆”,不妨今天就试试Mercury。毕竟,能让开发者放心睡个好觉的工具,本身就值一个Star。
夜雨聆风