AionUi 大统管 :统一操控OpenClaw 与 Hermes Agent龙虾集群跨平台系统
AionUi 大统管 :统一操控OpenClaw 与 Hermes Agent
龙虾集群跨平台系统
最近发现了一个开源AI智能体项目AionUi,26k star,说是能统一管理 Claude Code、Codex CLI、Hermes Agent、OpenClaw、Gemini CLI 等 CLI 工具。
我当时第一反应:又一个套壳?
装上去用了下感觉还不错。

AionUi 是什么
项目地址:https://github.com/iOfficeAI/AionUi
简单来说它是 一个本地运行的、免费开源的 AI 协作桌面客户端,能统一接管你机器上所有的 CLI AI 工具,同时自带一个开箱即用的 Agent 引擎。
和普通 AI 聊天客户端的区别在哪?普通客户端给你一个对话框,你问它答。AionUi 的定位是 Cowork——AI Agent 在你的电脑上实际执行任务,读写文件、跑脚本、搜网络、生成文档,你能看到每一步在干什么,需要的时候介入审批,不需要的时候让它全自动跑。
所有数据存在本地SQLite存储,不往任何服务器上传。
内置 Agent
我以为用 AionUi 的前提是先装好 Claude Code 或者 Hermes Agent。
结果完全不是。
AionUi 自带一个 Agent 引擎(叫 Aion CLI,Rust 写的),安装完直接可以用。能干的事情一点不含糊:本地文件读写、网页搜索、图片生成、MCP 工具调用。

登录方式也足够傻瓜:用 Google 账号登录就能直接用 Gemini()(免费额度),或者粘一个任何平台的 API Key 进去。国内的通义千问、Kimi、DeepSeek、智谱等模型都在支持列表里,还有 Ollama 和 LM Studio() 的本地模型。

一共支持 20 多个 AI 平台。换句话说,你手头有哪个平台的 key,直接粘进来就行。
多 Agent 模式
如果你已经装了 Claude Code、Hermes Agent 或者 OpenClaw,AionUi 会自动检测并接入,在同一个界面里统一管理。
目前官方列出的支持列表包括:Claude Code、Codex、Qwen Code、Goose AI、OpenClaw、Augment Code、CodeBuddy、Kimi CLI、OpenCode、Factory Droid、GitHub Copilot、Kiro、Hermes Agent、Cursor Agent、Snow CLI……一共 20 多个。
几个值得说的细节:
MCP 统一管理:配置一次 MCP(Model Context Protocol)服务器,自动同步到所有接入的 Agent,不用每个工具各配一遍。这个我很喜欢,以前每次加新工具都要重新折腾 MCP 配置,烦透了。
YOLO 模式:一键跳过所有权限确认提示,让 Agent 全自动跑。适合你完全信任任务内容、不想被打断的场景。
并行会话:多个 Agent 同时运行,上下文相互独立,互不干扰。
Team Mode:让多个 Agent 分工协作
这个功能我觉得比较超前——你可以设一个 Leader Agent,接收你的指令后把任务拆分成子任务,分发给多个 Teammate Agent 并行执行,结果通过异步消息汇总。
Leader 支持的后端包括 Claude Code、Codex、Hermes Agent、Gemini、Snow CLI 和 Aion CLI。所有 Agent 共享同一个工作目录,各自有独立的权限确认弹窗,侧边栏有 badge 提示待审批操作。
任务执行中途还能动态加减 Teammate。长时间没响应的 Agent 会自动被标记为 failed,一键删除。
定时任务:真正的 24/7 无人值守

支持三种调度方式:
-
标准 5 字段 Cron() 表达式,带时区支持(比如 0 9 * * 1,Asia/Shanghai) -
固定间隔,比如每 30 分钟跑一次 -
单次触发,指定时间执行完就自动停用
两种执行模式:
-
在原有会话里继续执行,AI 保留完整上下文历史 -
每次新建会话,适合独立的周期性任务
任务运行期间,AionUi 会自动阻止系统休眠,睡醒之后还能检测到漏跑的触发。
实际用途很好想:每天早上定时跑一个数据聚合、每周生成一份报告、每月做一次文件整理……你写好 prompt,剩下的交给它。
20 个内置 AI 助手
除了基础的 Cowork 通用助手,AionUi 还内置了一堆场景化助手,挑几个说:

Office 三件套(PPT Creator、Word Creator、Excel Creator):底层用 OfficeCLI(同一个团队的另一个开源项目)来生成可编辑的 .pptx / .docx / .xlsx 文件。PPT 还支持 Morph 过渡动画,效果看下面这个 GIF。
生成出来的文件直接能在 Office 里打开编辑,不是那种截图交付。
Excel 助手也值得单独说一下,直接上演示:
UI/UX Pro Max:57 种风格、95 个配色方案,生成 UI 设计稿。我没仔细测这个,感兴趣的自己试试。
Story Roleplay:支持角色卡和世界书,SillyTavern 格式兼容。
Planning with Files:Manus 那种持久化 Markdown 规划流程,把复杂任务拆成 plan 文件来追踪执行进度。
3D Game:单文件 3D 游戏生成,有点好玩。
助手都是 Markdown 文件定义的,放在 assistant/ 目录下,自己改或者新建也很方便。
预览面板:生成结果当场看
AI 生成的文件不用切出去打开,直接在 AionUi 内置的预览面板里看。
支持格式覆盖得挺全:PDF、Word、Excel、PPT、代码文件(30+ 语言)、Markdown、HTML、图片(PNG/JPG/SVG/WebP 等)、Diff。还支持实时编辑 Markdown 和代码,有版本历史可以回滚。
远程访问:手机上也能控制
WebUI 模式:开一个本地 HTTP 服务,同一局域网内的手机/平板/其他电脑直接用浏览器访问,QR 码或密码登录。跨网段访问需要穿透,项目Wiki 里有教程。
消息平台集成:
– 飞书()
-
钉钉 -
微信 -
Telegram
配置路径:设置 -> 远程连接 -> Channels,选择一个消息渠道,比如微信直接扫码登录即可。
你以后可以在外面掏出手机,给跑在家里电脑或迷你主机上的 Agent 发一条指令,它自动执行完发结果给你。
安装方式
系统要求:
-
macOS 10.15+ -
Windows 10+ -
Linux(Ubuntu 18.04+ / Debian 10+ / Fedora 32+) -
内存 4GB+,磁盘 500MB+
安装:
去 GitHub Releases 页面下载对应平台的安装包:
https://github.com/iOfficeAI/AionUi/releases
macOS 用户可以直接用 Homebrew:
brew install aionui装完打开,Google 登录或者粘 API Key,内置 Agent 直接可用。如果已经装了 Claude Code 之类的 CLI 工具,AionUi 会自动检测到。
使用建议
Step 1:先跑内置 Agent
打开新对话,选默认的 Cowork 助手,随便试一个文件操作任务——比如「帮我整理一下桌面上的文件,按类型分文件夹」。看 Agent 怎么规划、执行、确认权限。
Step 2:接入你已有的 CLI 工具
如果机器上装了 Claude Code 或 Hermes Agent,去设置里看 Multi-Agent 配置,应该已经自动检测到了。切换 Agent 直接在对话头部的下拉菜单里选。
Step 3:配 MCP
设置 -> MCP 配置,把你常用的 MCP 服务器加进来,所有 Agent 共享。
Step 4:设一个定时任务试试
选一个你经常重复做的任务,在 AionUi 里写好 prompt 跑顺之后,右键会话 -> 新建定时任务,设个 Cron 表达式,让它自己跑。
Step 5(可选):手机控制
微信最简单,直接扫码即可。然后选择默认对话Agent(AionCLI、OpenClaw、Hermes等)、模型。
谁适合用
如果你已经在用 OpenClaw、Hermes Agent、Claude Code,AionUi 相当于给它们加了一个统一管理面板,主打桌面端,不适合纯命令行下的虚拟机/VPS上跑。
如果你还没上手任何 CLI AI 工具,AionUi 的内置 Agent 是个不错的入门选择,不用折腾任何命令行,用 Google 账号登录就能免费跑 Gemini。这对非程序员来说,比OpenClaw、Hermes、Claude Code要友好很多。
如果你对「多 Agent 协作」这件事本身感兴趣,团队协作模式值得深挖。
项目Apache-2.0 协议,代码完全开源。
虽然还有些BUG(我这里Hermes用不了,OpenClaw正常),但瑕不掩瑜,最近也一直在更新,自带中文好评,希望赶快修复Hermes不能正常使用的BUG。
45个Hermes Agent / OpenClaw自动化案例(上)
昨天我随手打开了一篇推文。
作者说他花了一个周末,用 AI 工具搭了 45 个自动化,现在每周能省 20 小时,全程零代码。
他用的是 Claude + Cowork,我就想那 Hermes Agent() 和OpenClaw 能不能做一样的事?
于是我研究了下,发现有些地方Hermes和OpenClaw做更方便——因为它俩的核心设计就是”让 Agent 在你的机器上持续跑着,自动做事”。
下面以Hermes Agent为例,实现这45个自动化任务。
一、内容创作自动化(1–10)
早间热点扫描器 原效果: 每天早上 7 点,自动搜索我所在领域的热门话题,汇总成简报存入 /Trends 文件夹。 OpenClaw/Hermes 实现:
设置一个每天早上 7 点运行的 cron 任务:
搜索 AI Agent 领域今日热点,整理为 Markdown 简报,
保存到 ~/hermes/Trends/ 文件夹,并通过 微信发给我。Hermes 内置 Web 搜索工具,为了更好的搜索效果,先去https://www.tavily.com/注册个账号,获取到API Key后编辑.env文件加入TAVILY_API_KEY=你的Key。 重启网关后用自然语言设置 cron*()*,直接在对话里说就行:
"帮我设置一个每天早上 7 点的定时任务,
搜索 AI Agent 领域的今日热点……"暂时无法在飞书文档外展示此内容
文章初稿生成器 原效果: 给它一个选题和资料摘要,生成符合我个人风格的 2000 字初稿。 OpenClaw/Hermes 实现:
把你的写作风格指南存入
MEMORY.md或单独的 Skill 文件:hermes memory set "写作风格" "口语化、有悬念开头、不用结论前置……"或者让Hermes创建一个
writing-style.md的 Skill,把你最满意的几篇文章作为示例附进去。每次写作时 Hermes 都会自动加载这些记忆和你的写作Skill。
长文拆解成小红书文章 原效果: 把长文转成 Twitter 推文,每条 280 字符内,第一条强钩子,最后一条 CTA。 OpenClaw/Hermes 实现(国内版):
帮我把以下文章拆解成 10 条小红书笔记风格的段落:
- 第 1 条:强悬念开场,不透露结论
- 中间 8 条:每条一个知识点,配表情符号
- 最后 1 条:总结 + 关注引导
[粘贴文章]把这个 prompt 存成一个 Skill,以后直接和Hermes说:
这篇文章拆解为小红书笔记
标题 A/B 变体生成器 原效果: 每篇内容生成 10 个标题变体,覆盖好奇心缺口、数字具体化、损失厌恶、身份认同等框架。 OpenClaw/Hermes 实现:
把你历史上表现最好的 5 个标题作为示例。让 Hermes给你做个Skill:
基于以下高转化标题的规律,为「[选题]」生成 10 个标题变体:
[示例标题 1-5]
要求覆盖:好奇心缺口 / 数字具体化 / 损失厌恶 / 身份认同 四种框架各至少 2 个
内容日历生成器 原效果: 每周日,检查近期已发内容,找出空白,结合热点,为下一周规划选题和钩子。 OpenClaw/Hermes 实现:
"每周日晚上 9 点,读取 ~/Articles/Published/ 里的文章列表,
结合当前 AI 领域热点,为下周生成 7 个选题和对应的开篇钩子,
保存为 weekly-plan.md"先授权 Hermes 读取你的已发文章文件夹,然后设置定时任务就完成了。
Newsletter 生成器 原效果: 自动从本周内容中提取精华,加个人点评,组成 Newsletter 模板。 OpenClaw/Hermes 实现:
从 Skills Hub() 安装
newsletter技能(比如字节的newsletter-generation)。设置每天定时任务,让 Hermes 读取本日文章,按 Newsletter 格式输出并发送。
多平台配文生成器 原效果: 一篇内容,同时生成适配推特、LinkedIn、Instagram、Threads 的配文版本。 OpenClaw/Hermes 实现(国内版):
把文章改写为以下 4 个平台版本:
- 微信公众号文章(2500 字,正式有深度)
- 小红书笔记(350 字,口语化,加 emoji)
- B 站视频简介(150 字,引导关注)
- 知乎回答导流版(300 字,从问题视角切入)
SEO / 搜索优化分析器 原效果: 分析文章与目标关键词的匹配度,优化结构,补充缺失子话题,重写 meta 描述。 OpenClaw/Hermes 实现:
在 Skill 文件中存入你的 SEO 检查清单(关键词密度、标题层次、内链建议等)。每次发布前作为文章的”出厂检测”流程跑一遍,确保没有遗漏。
内容表现周报 原效果: 每周一汇总上周内容数据,分析哪类内容效果最好,发现规律。 OpenClaw/Hermes 实现:
把平台开放的 API(微信公众号/知乎均有数据接口)文档发给Hermes,让它写个脚本定期获取数据。然后让它分析规律并给出下周选题建议。
语音转文章流水线 原效果: 录一段 10 分钟语音,转录后 AI 直接输出成品文章。 OpenClaw/Hermes 实现:
用任何转录工具(讯飞、手机录音机)得到文字稿,然后让 Hermes 加载你的写作风格 Skill 进行润色。口语转书面、保留原意、补充逻辑过渡——整套流程十分钟内完成。
二、邮件与沟通自动化(11–20)
收件箱优先级分类 原效果: 读取未读邮件,分类(需要行动 / 仅供参考 / 可删除),顺便草拟回复。 OpenClaw/Hermes 实现:
通过 Gmail MCP(
hermes mcp add gmail)或飞书 Bot 接入邮件。设置每天早上处理一次:读取最近 24 小时未读邮件,分为三类:
- 🔴 需要我回复
- 🟡 只需知晓
- ⚪ 可直接归档
对"需要回复"类,草拟简短回复供我确认后发送。
跟进提醒生成器 原效果: 扫描过去一周发出的邮件,找出未获回复的,草拟跟进信息。 OpenClaw/Hermes 实现:
设置每周五定时任务,让 Hermes 扫描已发邮件,标记 5 天以上无回复的,自动生成礼貌的跟进草稿——不再因为忘了跟进而丢掉机会。
会议预备简报 原效果: 开会前,自动整合对方信息、历史沟通记录、相关文档,生成一页简报。 OpenClaw/Hermes 实现:
接下来我要和[对方名字/公司]开会,帮我:
1. 搜索对方近期公开信息和动态
2. 读取 ~/Emails/ 里我们的历史往来(如有)
3. 生成一份一页纸的会前简报:
背景 / 上次沟通要点 / 这次可能的关注重点
会议纪要结构化处理器 原效果: 粘贴原始会议记录,自动提取决议、行动项、待确认问题、下一步计划。 OpenClaw/Hermes 实现:
这是最简单的一类,单个 prompt 保存为 Skill 即可:
请将以下会议原始记录结构化处理,提取:
- ✅ 已确定决议(带负责人)
- 📋 行动事项(带截止日期)
- ❓ 待解决问题
- 📅 下次跟进节点
冷启动外联信生成器 原效果: 给出对方姓名和公司,自动调研后写一封不像模板的个性化开发信。 OpenClaw/Hermes 实现:
Hermes 内置 Web 搜索,直接用:
帮我写一封给[对方名字]的首次联系邮件:
- 先搜索他/她的公开信息和近期动态
- 找到一个真实的切入点(不要虚假恭维)
- 邮件控制在 150 字以内,开门见山
客户进展周报生成器 原效果: 每周自动汇总项目进展,生成可直接发给客户的进度更新邮件。 OpenClaw/Hermes 实现:
维护一个
project-log.md文件,每天记录关键进展。设置每周五定时任务:读取 ~/Projects/[项目名]/project-log.md,
生成本周客户进展周报:已完成 / 进行中 / 下周计划,
格式专业,控制在 300 字。
飞书 / 企业微信消息摘要 原效果(原文为 Slack): 每天汇总重要频道消息,过滤噪音,给你真正需要知道的 10 条。 OpenClaw/Hermes 实现:
Hermes 支持飞书 / 企业微信消息网关。配置好后,设置每天下班前的定时任务:
扫描今日[飞书群名]频道消息,过滤:
- 纯闲聊
- 已解决的问题
保留:决定、待办、重要通知,生成日摘要推送给我。
拒绝信个性化生成器 原效果: 对于需要婉拒的邀请/申请,生成专业得体、有温度的拒绝信。 OpenClaw/Hermes 实现:
以下是一封我需要婉拒的[合作邀请/投稿/采购需求],
帮我写一封拒绝信:
- 语气真诚,不敷衍
- 简短提及对方具体需求,显示我确实读了
- 如有可能,给出一个替代建议
[粘贴原邮件]暂时无法在飞书文档外展示此内容
个性化感谢信生成器 原效果: 会后/合作后,自动生成引用具体细节的感谢信,30 秒内发出。 OpenClaw/Hermes 实现:
我刚刚结束了和[对方]关于[主题]的会面,
对方提到了[具体细节 1]和[具体细节 2]。
帮我写一封 100 字以内的感谢信,
引用这些具体细节,真诚但不过度客套。
常见问题库生成器 原效果: 分析历史邮件,归类高频问题,生成完整 FAQ 文档。 OpenClaw/Hermes 实现:
把历史读者提问整理成文本文件,让 Hermes 分析:
读取 ~/FAQs/reader-questions.txt,
识别高频问题类别,为每类写一个标准答复,
输出为可以直接发布的 FAQ Markdown 文档。45个Hermes Agent / OpenClaw自动化案例(下)
下面会用到安装技能(Skill),这里先发下如何搜索和安装:
# 搜索 Skills Hub Skill
hermes skills search "关键词"
# 安装(ID 可以是 hub 标识符或 SKILL.md 的直接 URL)
hermes skills install <skill-id>三、调研与分析自动化(21–30)
竞争对手动态监控 原效果: 每周扫描竞争对手的新闻、产品更新、定价变化,生成竞情简报。 OpenClaw/Hermes 实现:
# 设置每周一早上 8 点定时任务:
搜索以下项目的本周动态:[Hermes Agent、OpenClaw、n8n、Dify……]
重点关注:版本更新、官方公告、社区讨论热点
整理为竞情简报,推送到我的微信。
行业新闻日报 原效果: 每天早上搜索行业最新动态,过滤后生成 5 条要点摘要。 OpenClaw/Hermes 实现:
设置每天 6:30 的定时任务,搜索 AI Agent() / 开源大模型领域当日要闻,5 条核心摘要推送到你的消息平台——省去订阅几十个 Newsletter() 的麻烦。
论文 / 技术文档速读器 原效果: 上传论文,得到结构化摘要:核心发现、方法、局限性、对我工作的启发。 OpenClaw/Hermes 实现:
从 Skills Hub() 安装 PDF 处理技能,然后:
读取这篇论文 [文件路径],生成以下结构的摘要:
- 核心结论(3 点)
- 研究方法简述
- 局限性
- 对 [我的领域] 的实际意义
市场规模估算器 原效果: 给出产品方向和目标市场,基于可查数据估算市场规模,并展示假设前提。 OpenClaw/Hermes 实现:
我在做[产品方向],目标用户是[描述],
帮我用 TAM/SAM/SOM 框架估算市场规模,
数据来自公开报告(请搜索),
明确列出每个关键假设,给出区间而非单一数字。
调研结果分析器 原效果: 粘贴原始问卷数据,识别主要主题、统计分布、意外发现,生成可展示的摘要。 OpenClaw/Hermes 实现:
安装 XLSX 技能处理数据,或直接粘贴文本:
分析以下问卷回复数据:
- 统计各选项分布
- 识别开放题中的高频主题(3-5 个)
- 指出最出乎意料的发现
- 生成可放入 PPT 的一页摘要
合同 / 协议白话解读器 原效果: 上传任何合同,得到义务、截止日期、风险点、异常条款的白话摘要。 OpenClaw/Hermes 实现:
读取这份合同文件,用普通人能懂的语言总结:
- 我需要做什么(义务清单)
- 关键截止日期
- 潜在风险条款(标注为高/中/低风险)
- 任何与通常合同不一样的地方
(注:此摘要不构成法律建议)
专利 / 现有技术检索器 原效果: 描述一个发明或功能,搜索现有专利和相似产品,识别潜在冲突和差异点。 OpenClaw/Hermes 实现:
以下是我的产品功能描述:[描述]
搜索现有专利数据库和类似产品,
识别:相似解决方案 / 潜在专利冲突风险 / 我的方案的差异化角度。
读书笔记主题化整理器 原效果: 把读书高亮和笔记喂给 AI,按主题分类,提炼核心原则,生成行动计划。 OpenClaw/Hermes 实现:
以下是我读《[书名]》时记录的笔记和划线段落,帮我:
1. 按主题归类(3-5 个主题)
2. 每个主题提炼 2-3 条核心原则
3. 生成一份基于本书的个人行动清单
趋势预测分析器 原效果: 综合多方信息,预测哪些话题在涨、在顶、在跌。 OpenClaw/Hermes 实现:
# 设置每两周运行一次
搜索以下信息,分析 AI Agent 领域话题趋势:
- GitHub Star 增长速度
- 各大技术社区讨论热度
- 主流媒体报道频次
输出:上升趋势 / 顶部区间 / 降温话题 各 3 个,附理由。
数据规律发现器 原效果: 上传任意表格,识别模式、异常值、相关性,输出带具体数字的摘要。 OpenClaw/Hermes 实现:
安装 XLSX 技能后:
分析 [文件路径] 中的数据:
- 找出最显著的规律和趋势
- 标记异常值
- 识别变量间的相关性
- 用 execute_code 工具生成可视化图表,展示最重要的 3 个发现四、文件与组织自动化(31–37)
下载文件夹整理器 原效果: 每周扫描下载文件夹,按类型归类,统一命名,删除 60 天以上旧文件。 OpenClaw/Hermes 实现:
# 每周日晚 11 点定时任务
整理 ~/Downloads/ 文件夹:
- 图片 -> Images/,文档 -> Docs/,压缩包 -> Archives/
- 按 "YYYYMMDD_原名" 格式重命名
- 删除超过 60 天且文件名包含"截图/screenshot/temp"的文件
执行前先列出操作计划,我确认后再执行。
报销票据处理器 原效果: 每月扫描收据图片,提取日期/金额/类别,生成分类汇总表格。 OpenClaw/Hermes 实现:
# 每月 1 号定时任务
读取 ~/Receipts/ 文件夹里上个月的票据图片,
识别每张票据的:日期、商家、金额、费用类别
汇总为 XLSX 表格,按类别统计合计,
保存到 ~/Finance/2026-[月份]-expenses.xlsx
批量文件重命名器 原效果: 按自定义规则批量重命名文件,客户文件加客户名前缀,发票加日期。 OpenClaw/Hermes 实现:
重命名 ~/Projects/[客户名]/ 下所有文件:
- 所有文件加前缀 "[客户名]_"
- 日期格式统一为 YYYYMMDD
- 删除文件名中的空格,替换为下划线
在执行前显示重命名预览,我确认后再操作。
PDF 合并工具 原效果: 按指定顺序合并多个 PDF,用于组装提案包或报告集。 OpenClaw/Hermes 实现:
先让Hermes搜索并安装 PDF Skill,然后:
按以下顺序合并 PDF:
1. ~/Docs/cover-letter.pdf
2. ~/Docs/project-proposal.pdf
3. ~/Docs/portfolio.pdf
输出为 ~/Docs/complete-proposal-20260526.pdf
知识库更新器 原效果: 每个项目结束后,把原始笔记整合进知识库,正确标签、链接、分类。 OpenClaw/Hermes 实现:
读取 ~/Projects/[项目名]/raw-notes.md,
提取值得长期保留的经验和知识点,
按主题分类后追加写入 ~/KnowledgeBase/[对应主题].md,
在文件头部更新日期和来源标记。
发票生成器 原效果: 给出客户名、项目详情、金额,自动生成 PDF 发票,存档,起草发送邮件。 OpenClaw/Hermes 实现:
在 Skills 目录存一个你的发票模板,然后:
为以下项目生成发票:
客户:[客户名] / 项目:[项目描述] / 金额:[X]元 / 付款期限:30 天
使用 ~/Templates/invoice-template.md 格式,
保存为 ~/Invoices/INV-202605-[客户名].pdf,
并草拟一封附发票的催款邮件。
备份核查器 原效果: 每周检查关键文件是否已备份,对比文件夹大小变化,标记异常。 OpenClaw/Hermes 实现:
# 每周五晚 10 点定时任务
检查以下目录的文件大小与上周记录对比:
- ~/Projects/(核心项目)
- ~/.hermes/(Agent 配置和 Skills)
- ~/Articles/(文章存档)
如果某个目录缩小超过 10%,发出警告到 Telegram。
把当前状态记录到 ~/Backups/weekly-check.log五、业务与效率自动化(38–45)
周回顾报告编译器 原效果: 每周五,自动汇总本周完成事项、项目进展、关键指标,记录成果、阻碍和下周重点。 OpenClaw/Hermes 实现:
维护一个每日更新的
daily-log.md,设置每周五定时任务:读取本周的 daily-log.md,生成周回顾报告:
- 本周完成的 Top 5
- 未完成原因分析(客观 vs 主观)
- 下周 Top 3 优先级
保存为 ~/Reviews/week-[日期].md,推送摘要到 Telegram。
客户提案生成器 原效果: 给出客户需求、项目范围和预算区间,生成包含执行摘要、方案、时间线、定价的完整提案文档。 OpenClaw/Hermes 实现:
在 Skills 文件夹放入你的提案模板,安装 DOCX 技能后:
为以下客户生成项目提案:
客户:[名称] / 需求:[描述] / 预算区间:[X-Y 万]
使用 ~/Templates/proposal-template.md,
输出完整 Word 文档到 ~/Proposals/[客户名]-proposal.docx
客户好评收集器 原效果: 监控邮件和消息中的正面反馈,格式化后存入 /Testimonials 文件,随时可用于提案和落地页。 OpenClaw/Hermes 实现:
# 每周日定时任务
读取本周邮件和消息记录,
识别包含正面评价的内容(关键词:谢谢、很好、解决了、推荐、满意……)
提取关键评价原文,格式化为:
「[评价内容]——[对方名称],[日期]」
追加写入 ~/Marketing/testimonials.md
客户入职资料包生成器 原效果: 每个新客户,自动生成欢迎邮件、项目时间线、需求问卷、品牌素材需求表——全套一次出齐。 OpenClaw/Hermes 实现:
为新客户[客户名]生成完整入职资料包:
项目类型:[公众号内容代运营] / 启动日期:[日期]
生成:
1. 欢迎邮件(正式但有温度)
2. 第一个月项目时间线(关键节点)
3. 内容需求问卷(15 题)
4. 品牌素材清单(需要提供的文件类型)
全部保存到 ~/Clients/[客户名]/onboarding/
项目报价计算器 原效果: 描述项目范围,根据历史数据估算工时,套用时薪,加复杂度系数,输出分项报价。 OpenClaw/Hermes 实现:
在 MEMORY.md 中记录你的历史项目工时数据和时薪,然后:
新项目报价:
需求:[描述]
参考我过去的类似项目工时记录,
估算本次工时(给出区间,说明假设),
套用我的时薪 [X 元/小时],
加 20% 复杂度缓冲,
输出含分项明细的报价单。
流程 SOP() 文档生成器 原效果: 描述任何重复流程,自动生成带编号步骤、决策节点、质检标准的标准操作文档。
OpenClaw/Hermes 实现:
我有以下重复流程需要文档化:
[用口语描述你怎么做这件事]
帮我整理成标准 SOP:
- 编号步骤(不超过 15 步)
- 每个决策点标注"如果……则……"
- 关键步骤标注质量检查标准
- 结尾附常见错误清单
输出为 ~/SOPs/[流程名].md
目标追踪月报 原效果: 每月,对照既定目标检查实际进展,计算完成率,分析落后原因,建议下月调整。 OpenClaw/Hermes 实现:
在
USER.md中记录你的季度目标,每月底运行:读取我的目标文件和本月 daily-log.md,
生成月度目标追踪报告:
- 每个目标完成百分比(用数据说话)
- 未达标原因分析(客观原因 vs 主观原因)
- 下月具体调整建议(要可执行,不要废话)
每日大脑清空处理器 原效果: 每晚语音 dump——把脑子里所有事情说出来,转录后 AI 自动分类:任务 / 想法 / 跟进 / 可以忘的。 OpenClaw/Hermes 实现:
这是我个人最喜欢的一个。Hetmes安装语音插件,或用讯飞或手机录音机转录后,发给 Hermes:
以下是我今晚的大脑清空语音转录,帮我分类处理:
- 📋 任务(具体行动项)-> 追加到 ~/Tasks/today.md
- 💡 想法(值得进一步探索的)-> 保存到 ~/Ideas/[日期].md
- 📞 跟进(需要联系某人的)-> 保存到 ~/FollowUp/[日期].md
- 🗑️ 可以忘的(不重要的担忧或念头)-> 直接丢弃
[粘贴转录稿]真正重要的事
45 个自动化看起来很多,实际上不是。
每一个的搭建时间在 5 到 30 分钟之间。最简单的就是一个存好的 prompt 当 Skill 用,最复杂的是一个定时任务加上文件访问权限。
重点不是把 45 个全做完,而是今天就做一个。
从这个列表里找出最省你时间的那一个,现在就去做。不是明天,不是”有时间再说”,是现在。很多人会把这篇文章收藏,然后永远不会动手。
在搭建过程中遇到问题,或者发现了更好的 实现方式和新的案例,欢迎评论区讨论——我会持续更新这份清单。
AI Agent三宝“CLI、MCP、Skill”如何选
最近 IBM Technology 出了一期视频,比较 AI Agent 分别用命令行和 MCP() 做同样的事,看谁表现好。结论挺有意思:简单的文件操作和 Git 命令行赢,抓渲染过的网页 MCP 赢。
但看完之后我一直在想一个问题:这两种方式好像都没覆盖到我实际用 Agent 时最依赖的那个——Skill。
今天把这三种方式放在一起聊聊。
先快速过一下这三个
CLI() 就是命令行。Agent 跑
cat、grep、curl、git这些,跟你我在终端里敲的一模一样。模型在训练时已经见过海量命令行示例,对这些命令的参数、用法烂熟于心,不需要额外说明。MCP(Model Context Protocol)是 Anthropic 2024 年底发布的开放协议。专门的服务器对外暴露一组结构化工具,每个工具有名字、有说明、有 JSON schema。Agent 想用就调。
问题是,所有工具的 schema 在对话开始时就全塞进上下文窗口了。Martin Keen 测试的 GitHub MCP 服务器大约有 80 个工具,全部加载大概 55,000 个 token。你可能只需要其中一两个,但得把 80 个的说明书全带上。
Skill 本质上是一份操作手册。一个 markdown 文件,里面写着:什么场景下用、具体怎么操作、有哪些坑、怎么验证结果。
举个例子。我有一个 Skill 叫
youtube-subtitle-research,内容大概是这样的:去 YouTube 搜某个关键词,筛选最近 24 小时的视频,下载字幕,去重处理,然后分析内容。里面写了具体用什么命令、文件存哪个路径、日期过滤为什么要做两遍、哪个 Python 脚本处理字幕效果最好。这些知识不是模型训练数据里的。是我自己跑过几次之后,踩了坑,总结出来的。
三者的区别
说说我的理解:
CLI — 模型脑子里已有的知识。零额外开销,但只能干命令行本身能干的事。比如
grep -n agent *.md,模型不需要任何人教就知道怎么用。MCP — 外挂的结构化接口。适合命令行搞不定的事(渲染 JavaScript 网页、调需要认证的 API),但每个工具的 schema 都要占 token,不管你用不用。
Skill — 外挂的程序性知识。不是告诉模型”有这个工具”,而是告诉模型”这件事怎么做”。里面可以包含 CLI 命令、MCP 调用、甚至其他 Skill 的引用。按需加载,不用的时候不占空间。
打个比方。CLI 是你会开车。MCP 是车上装了全套导航系统,80 条预设路线全加载好。Skill 是副驾坐了个老司机,到了特定路口才开口说”这个路口得走辅路,主路在修”。
视频中的三个实验,Skill 能插在哪
实验一:读文件 + 搜关键词
Agent 要读一个 markdown 文件,再搜另一个文件里有没有”agent”这个词。
CLI 方案:
cat notes.md+grep -n agent *.md。两条命令搞定。MCP 方案:调文件系统服务器的
read_file和search_files。也完成了,但 13 个工具的 schema 全加载了,只用了 2 个。这个场景太简单了,不需要 Skill。
实验二:Git 操作
CLI 方案:
git log --oneline -10+git status。模型对 Git 熟得很。MCP 方案:GitHub MCP 服务器,80 个工具,55,000 token。
这个场景如果加个 Skill 呢?假设你有个
git-workflow的 Skill,里面写着”检查状态前先 fetch 一下远程”、”如果在 feature 分支上,顺便看一眼 main 有没有新提交”、”提交信息用 conventional commit 格式”。这些是你的团队规范,不是 Git 的通用知识。模型会用 Git,但不会自动遵守你们团队的约定。Skill 补的就是这个缺口。
实验三:抓网页
MCP 方案:调了一个带无头浏览器*()*的 MCP 服务器,加载页面、渲染 JavaScript、转成文本。250 token,几秒钟。
CLI 方案:
curl拿到的是 Next.js 的 JavaScript 骨架,不是渲染后的内容。Agent 花了好几分钟尝试各种办法,写 Python 脚本逆向工程 Next.js 的数据格式,最后勉强搞定。2000 多 token,大量本地计算。这个场景 MCP 赢得毫无悬念。但如果我经常要抓网页做内容分析,我会写一个 Skill:什么类型的页面用什么方式抓、碰到 SPA() 怎么处理、抓回来的内容怎么清洗、存到哪个目录、文件命名规则是什么。下次 Agent 再碰到类似任务,加载这个 Skill,直接走最优路径,不用每次都重新摸索。
Skill 的真正优势:上下文按需加载
MCP 最被诟病的一点是”不管你用不用,schema 全塞进去”。80 个工具,55,000 token,对话还没开始上下文窗口已经胖了一圈。
Skill 不一样。它是按需加载的。Agent 根据当前任务判断”这个场景可能需要哪个 Skill”,然后才去读。用完就完,不常驻。
一个典型的 Skill 文件大概 2,000 到 10,000 字符。只在需要的时候出现。而且 Skill 里面可以组合着用——引用 CLI 命令、调用 MCP 工具、甚至调用其他 Skill。它不是一个新层级的工具,而是在 CLI 和 MCP 之上的”怎么做”的知识层。
Skill 的另一个好处:会进化
CLI 命令是操作系统定的,你改不了。MCP 服务器的 schema 是开发者写的,你也不太好动。
Skill 是你自己的 markdown 文件。踩了坑?加一行注意事项。发现更好的做法?改掉旧的步骤。Hermes Agent() 甚至有个自动管理功能,每隔几天给你的 Skill 库做一次体检:合并重复的、删掉过时的、给每个 Skill 打分。
模型本身也会在对话结束后自动回顾,把新学到的东西更新到 Skill 里。上个月我搞 YouTube 字幕下载的时候,第一次跑日期过滤出了 bug,修好之后 Agent 自己把修法写进了 Skill。下次再跑同样的任务,直接走正确路径。
这种”经验沉淀”是 CLI 和 MCP 都做不到的。
那到底该用哪个?
不是非此即彼。但我想把范围扩大一点:
命令行能搞定的事,用命令行。零开销,模型本来就会。
命令行搞不定的事(渲染网页、调需要认证的 API、对接第三方服务),上 MCP。代价是 token,但换来的是能力边界扩展。
需要特定流程、团队规范、踩坑经验的事,用 Skill。代价是初次编写的时间,换来的是以后每次都能走最优路径。
三种方式不是竞争关系,是分层的。CLI 是地基,MCP 是扩展件,Skill 是操作手册。最好的 Agent 三个都有,根据场景自己选。
说到底,如果你的 Agent 开始逆向工程一个 JavaScript 框架就为了读一个网页,那大概率是选错了工具。如果你的 Agent 每次做同一件事都要重新摸索一遍,那大概率是缺一个 Skill。
内置:视频剪辑、数据挖掘、情报监控、预测分析、深度研究、网页自动化、社交媒体管理
今天发现了一个新的AI Agent开源项目OpenFang*()*,它内置了七个技能:视频剪辑、数据挖掘、情报监控、预测分析、深度研究、社交媒体管理、网页自动化。
先说它内置的 7 个技能
OpenFang 把自动化能力封装成叫”Hands”的东西,但我觉得叫”技能”更好理解——每个技能都是一个自主运行的任务单元,有自己的调度计划、执行逻辑和结果输出。不需要你在旁边提示,它自己按时跑,跑完推送结果给你。
目前内置了 7 个:
视频剪辑技能(Clip)
给它一个 YouTube 链接。它下载视频,分析内容,找出最有价值的片段,自动剪成竖屏短视频,生成字幕和缩略图,还能加 AI 配音,最后推送到你的飞书或者Telegram。整个流程分 8 个阶段,底层调用 FFmpeg、yt-dlp,支持 5 种语音识别后端。
暂时无法在飞书文档外展示此内容
你不需要动手。视频到结果,全自动。
数据挖掘技能(Lead)
每天定时运行。你定义好理想客户画像——行业、规模、地区、关键词——它去网上搜索、核实、评分(0 到 100 分),把重复的去掉,把已有客户排除,最后以 CSV、JSON 或者 Markdown 格式把合格线索发给你。
跑的时间越长,它对你的客户画像理解越准,评分也越来越贴近实际需求。
情报监控技能(Collector)
给它一个监控目标,可以是公司、人物、话题或者关键词。它在后台持续追踪,做变化检测、情绪分析、知识图谱构建,一旦监测到重要变化,立刻发警报。
这个技能实质上是在做 OSINT*()*(开源情报)级别的信息追踪。竞品监控、关键人物动态、市场舆情,都能用。
预测分析技能(Predictor)
这个是我最意外的一个。它不只是做信息汇总,而是做预测——从多个来源收集信号,构建推理链,给出带置信区间的预测结论,然后用 Brier Score 追踪自己的历史预测准确率。Brier Score() 是专业预测领域用来量化预测质量的指标,0 最好,1 最差。
它还有一个”反向模式”,专门站在主流共识的对立面,强制论证反向结论。这对于避免信息茧房式的决策偏差有一定价值。
深度研究技能(Researcher)
自主做研究,交叉验证信息来源,用 CRAAP 标准评估可信度(时效性、相关性、权威性、准确性、目的性),生成带 APA 格式引用的研究报告。支持多语言。
这个技能最成熟,也是官方文档里最推荐的入门技能。
社交媒体管理技能(Twitter)
自主管理 X/Twitter 账号。用 7 种内容格式轮换创作,选最优时段发布,回复提及,追踪数据。所有内容发出去之前都会进审批队列,你不确认就不会发。
网页自动化技能(Browser)
Playwright() 驱动,有会话持久化,可以导航网页、填表、点按钮,处理多步骤工作流。有一个强制门控:任何涉及付款的操作,必须人工确认,没有例外。
后面详细说如何使用这些技能。
和 OpenClaw*()*、Hermes Agent 的区别
现在开源 Agent 这条赛道上,被讨论最多的三个项目是 OpenClaw、Hermes Agent 和 OpenFang。三者功能有重叠,但底层逻辑完全不同,适合的使用场景也不同。
先说各自是什么
OpenClaw 是网关优先的 Agent 平台。它的强项是把你的 AI Agent 接进尽可能多的渠道——飞书、微信、Telegram、Discord、Slack、WhatsApp、Teams等——让 Agent 在这些地方都能响应你的消息。它更像一个统一的 AI 控制台,把模型调用、渠道路由、会话管理都包进来。生态很成熟,ClawHub 上有 13000 多个社区技能。
Hermes Agent 是运行时优先的 Agent 框架。它的核心卖点是”会学习的 Agent”——每完成一个任务,它分析自己走过的步骤,把可复用的模式沉淀成新技能,下次遇到类似任务时直接调用。上下文使用情况可以直接看到,内存管理比较透明。由 Nous Research 开发,Python 写的。
OpenFang 是 Agent 操作系统。它不以渠道接入数量取胜,也不以学习能力为卖点,它做的是提供一个让 Agent 能安全、稳定、自主运行的执行环境——沙箱、调度、审计、内存、通信,全部内置。Rust 写的,编译成单一二进制文件,没有运行时依赖。
性能对比
这个差距用数字说最直接:
td {white-space:nowrap;border:0.5pt solid #dee0e3;font-size:10pt;font-style:normal;font-weight:normal;vertical-align:middle;word-break:normal;word-wrap:normal;}
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
性能上 OpenFang 有明显优势,这是 Rust 语言选型带来的。
自主运行能力
这是三者差距最明显的地方。
OpenFang 的 7 个内置技能是真正定时自主运行的——你不需要进行复杂的配置,它按计划工作,结果推送给你。OpenClaw 和 Hermes 需要自己找或开发这样的技能再配置定时任务。
学习能力
这是 Hermes 的独特优势,OpenFang 和 OpenClaw 都没有的功能。Hermes 在任务完成后会分析步骤、提炼模式、生成新技能,随着使用时间增长,它的能力会在你的工作流方向上变强。OpenFang 和 OpenClaw 的技能需要人工定义,不会自动生长。
生态成熟度
OpenClaw 目前生态最成熟,13000 多个社区技能、几十万用户、大量教程和问题解答。遇到问题能搜到的资料最多。Hermes 在快速追赶,社区活跃度持续提升。OpenFang 还很早期,社区小,文档覆盖度有限。
安全性
这是 OpenFang 目前做得最系统的地方,其他两个都没有类似的设计深度。16 个独立安全层,核心是 WASM 沙箱——所有工具代码在 WebAssembly 里运行,越不出沙箱。还有 Merkle 哈希链审计日志(改一条记录整条链断掉)、提示词注入扫描、密钥使用后内存抹除等。
对于需要在服务器上长时间无人值守运行 Agent 的场景,这个安全架构的价值会体现出来。
总结一下选哪个
如果你现在想快速跑起来一个能聊天、能自动化的 AI Agent,OpenClaw 生态最成熟,踩坑成本最低。
如果你想要一个随时间越用越聪明、技能库会自动增长的 Agent,Hermes 是最好的选择。
如果你需要在服务器上长期无人值守运行自动化任务,对安全隔离有要求,OpenFang 值得认真看。它的 7 个内置技能也是三者中唯一开箱即用的自主任务单元。
三个并不是非此即彼的关系,有人在生产环境里同时跑 OpenClaw 和 Hermes,OpenFang 也提供了一键从 OpenClaw 迁移的命令。
怎么安装和使用 安装
macOS 和 Linux:
curl -fsSL https://openfang.sh/install | shWindows(PowerShell):
irm https://openfang.sh/install.ps1 | iex安装完成后是一个约 32MB 的单二进制文件,没有其他依赖。
初始化
openfang init这一步会引导你配置 LLM 提供商。支持 27 个提供商,包括 Anthropic、OpenAI、Groq、DeepSeek、Ollama(本地)、vLLM、Qwen、Moonshot、百度千帆等。如果想免费先试,Groq 有免费额度且推理速度快,适合入门。
初始化完成后,配置文件在
~/.config/openfang/openfang.toml,也可以手动编辑。启动
openfang start启动后 Dashboard 在
http://localhost:4200,可以在浏览器里看到所有 Agent 的状态、任务进度、日志。另外还有 Tauri 2.0 的原生桌面 App,系统托盘常驻,支持全局快捷键和通知推送,不用每次打开浏览器。
和 Agent 对话
openfang chat researcher或者通过 OpenAI 兼容的 API 接口调用,把任何支持自定义 API endpoint 的客户端指向
localhost:4200/v1:curl -X POST localhost:4200/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "researcher",
"messages": [{"role": "user", "content": "分析一下当前 AI Agent 框架的竞争格局"}],
"stream": true
}'使用技能 研究技能(Researcher)
# 第一步:设定研究主题
openfang hand config researcher --set topic="2026年开源AI Agent框架竞争格局"
# 第二步:激活(这时候才真正开始工作)
openfang hand activate researcher
# 查看进度 / 等结果
openfang hand status researcher情报监控技能(Collector)
openfang hand config collector --set target="Anthropic" --set target_type="company"
openfang hand activate collector线索挖掘技能(Lead)
openfang hand config lead \
--set icp="B2B SaaS startup, Series A, 50-200 employees" \
--set output_format="csv"
openfang hand activate lead预测分析技能(Predictor)
openfang hand config predictor \
--set domain="technology" \
--set contrarian_mode=true
openfang hand activate predictor视频剪辑技能(Clip)
# Clip 略有不同,URL 是按需传的,不是预先设定
openfang hand run clip --url "https://www.youtube.com/watch?v=xxxxx"Twitter 管理技能
# 先开启审批队列(建议必须打开)
openfang hand config twitter --set approval_required=true
openfang hand activate twitter网页自动化技能(Browser) 也是按需触发,通过
openfang chat browser对话式下达任务,不是预设目标后自动跑。
结果在哪里看?三个地方都能找到:
• 仪表盘:
localhost:4200-> Hands 标签页,实时进度和输出• 终端:
openfang hand status researcher• 推送渠道:如果配了 飞书/Telegram,报告直接发到那里
查看所有可用技能:
openfang hand list从 OpenClaw 迁移
如果你现在跑着 OpenClaw,可以直接导入:
# 先 dry run 看看会变什么
openfang migrate --from openclaw --dry-run
# 确认没问题再正式迁移
openfang migrate --from openclawAgent 配置、对话历史、技能文件都会一起导入。SKILL.md 格式两者通用,ClawHub 的技能也能直接读取。
自己写技能
如果内置的 7 个技能不够用,可以自定义。在项目目录下建一个
HAND.toml:[hand]
name = "my-monitor"
description = "监控特定关键词并汇报"
schedule = "0 9 * * *" # 每天早 9 点运行
[tools]
required = ["web_search", "telegram_send"]配上 System Prompt 和 SKILL.md,然后发布到 FangHub(OpenFang 的技能市场)。
-
一些需要知道的事**
目前版本号是 v0.5.x,还不是正式版,估计还有BUG,建议不要用到生产环境。
目标是 2026 年中发布 v1.0。
Browser 和 Researcher 这两个技能是目前最成熟的,如果想试,从这两个开始比较稳。
项目地址:https://github.com/RightNow-AI/openfang
官网文档:https://openfang.sh/docs
Discord:https://discord.gg/sSJqgNnq6X
我准备试试这些技能好不好用,如果效果不错会单独写一篇实测。
有问题欢迎在评论区聊。
夜雨聆风


