我的AI助手装技能,现在它比我还能卷
一、浏览器自动化——AI开始”长手”了
🕷️ agent-browser:AI自己刷网页,你负责喝咖啡
能干啥?
你的AI可以自己打开浏览器、点击按钮、填写表单、截图、录屏,还能模拟手机操作。
用Rust写的,速度快到离谱,比Selenium/Playwright轻量一个量级。
实操举例:
打开网页 → AI自动识别可交互元素
snapshot -i → 获取元素列表,AI知道哪个框能填、哪个按钮能点
填表 → 提交 → 等结果
全程你不用碰键盘
典型场景:
-
🕸️ 数据爬取(比requests+BeautifulSoup优雅100倍) -
📋 自动填表:报税、抢票、填问卷 -
📸 网页截图存档(做内容存档超方便) -
🎬 录屏做教程 -
📱 手机端页面测试
📄 summarize:30秒,干完别人一小时的活
支持类型:
-
🔗 任意URL(网页、文章、新闻) -
📄 PDF(财报、论文、合同) -
🎥 YouTube视频(直接提取核心观点) -
🖼️ 图片(OCR+内容提取) -
🎙️ 音频文件
使用方法:
丢链接 → 等几秒 → 拿总结
适合:研究党、新闻狗、学生、时间宝贵的所有人。
二、搜索全家桶——17个引擎同时伺候
🔍 multi-search-engine
国内: 百度、Bing(中文+国际)、360、搜狗、微信搜索、头条搜索、雪球
国际: Google、Google HK、DuckDuckGo、Yahoo、Startpage、Brave、Ecosia、Qwant
Plus: WolframAlpha(数学计算/货币换算/股票查询)
高级操作:
site:github.com xxx # GitHub站内搜索
filetype:pdf xxx # 搜PDF文档
tbs=qdr:w # 限时间(过去一周/一月)
DuckDuckGo # 隐私模式,不追踪你
🔎 baidu-search
百度AI搜索API调用,适合需要百度搜索结果的场景(别问为什么需要,你懂的)。
三、金融资讯——散户的信息差终结者
📈 mx-finance-search(妙想搜索)
一句话:用自然语言搜东方财富全网公告+研报+新闻+政策。
以前查”寒武纪最近有啥公告”:
① 打开东方财富 → ② 搜股票名 → ③ 翻几十页 → ④ 一个个点开
现在:问AI "寒武纪688256最新研报与公告",5秒钟整理好给你。
需要: 东方财富妙想API Key(去 ai.eastmoney.com/mxClaw 注册)
📊 stock-analysis(自选股监控)
专门针对A股。
-
添加自选股到监控列表 -
自动每日更新K线数据 -
实时监控+报警 -
生成分析报告
适合: 盯盘的散户、想系统化管理自选股的投资者。
四、记忆系统——AI终于”长脑子”了
⚠️ 以下是整篇文章最核心的部分,请认真阅读。
🧠 ontology:知识图谱式记忆
普通AI的问题:
你说”张三是我技术合伙人,李四是产品负责人”。
普通AI:下次问”李四是谁?”——已读乱回。
装了ontology的AI:
知道 李四 → 是 → 产品负责人
知道 李四 → 和 → 张三 → 同事关系
还能推导出:张三和李四都是项目核心成员
内置实体类型:Person、Project、Task、Event、Document……覆盖日常工作全部场景。
🔄 self-improving + self-improving-agent:AI的”错题本”
你纠正AI一次 → 它记住不再犯第二次
命令失败一次 → 记录下来下次不踩坑
发现更好方法 → 记下来持续优化
这就是AI的”自我进化”能力——真正做到吃一堑长一智,而不是每次对话都”从零开始”。
⚡ proactive-agent:AI从”等活”变”抢活”
普通AI: 你说啥它干啥,像个没有眼力见的实习生。
装了proactive-agent的AI: 会主动预判你需要什么,提前做好。
举个例子:
你说:”用蓝色主题,以后不要红色。”
❌ 普通AI:回复”好的!” → 三天后又给你整成红色 → 你再纠正一遍 → 它再忘
✅ proactive AI:先把这句话写入长期记忆文件 → 再回复你
这就是WAL Protocol(先写后答原则): 收到重要信息 → 先存档 → 再回复。
配合 self-improving 使用: AI既主动,又记得住,两个字——靠谱。
五、办公效率——打工人之光
📧 gog:Google全家桶命令行版
Gmail / 日历 / 云盘 / 联系人 / 表格 / 文档,一条命令搞定。
场景:
-
每天定时整理Gmail未读邮件 → 写个cron,AI自动执行 -
临时查某人联系方式 → 1秒出结果,不用开浏览器 -
自动生成日历事件 → 开会安排不用手动输入
适合:深度用户、不喜欢点来点去的人、写脚本自动化办公的人。
📊 microsoft-excel:不用下载,直接读写
用API直接读写OneDrive上的Excel文件,不用本地打开,不用传来传去。
适合:多端同步数据、经常处理报表的打工人。
📝 obsidian:AI替你管本地笔记
Obsidian是什么?本地Markdown笔记工具,用过的都说香。
AI帮你做:
-
搜索笔记(一句话找到任何内容) -
创建新笔记 -
整理移动笔记(自动更新内部链接)
适合 Obsidian 重度用户,效率翻倍不止。
📋 database-query(TickFlow数据库)
连接TickFlow Assist的LanceDB数据库,执行查询、读取表结构、检索历史记录。
适合:需要查询TickFlow系统存储数据的技术人员。
六、开发利器——程序员标配
🛡️ skill-vetter / skill-vetter-v2:安装技能前的安检门
为什么需要?
AI技能市场鱼龙混杂。有些技能表面写着”帮你管笔记”,背地里可能偷偷读取你的SSH密钥。
skill-vetter就是技能的”安检仪”。
审查流程:
来源核查 → 代码逐行审查 → 权限评估 → 风险定级(低/中/高/极端)
发现红线直接拉黑:
-
🚫 请求你的API Key/密码 -
🚫 读取 /.ssh、/.aws 等敏感目录 -
🚫 混淆/加密代码(藏着掖着必有鬼) -
🚫 eval()/exec() 动态执行代码
建议: 每次安装外部技能前,先过一遍安检,别有侥幸心理。
🔧 find-skills / skillhub-preference:技能市场的”种草专区”
想实现某个功能?先来这里搜一下。
优先搜 skillhub(中文友好,速度快),找不到再 fallback 到 clawhub。
90%的情况是有现成的,不用自己造轮子。
七、实用工具——日常开挂
🌤 weather:天气查询
一句话查全球天气,支持 wttr.in 和 Open-Meteo 两个数据源,不需要API Key。
问”明天上海适合出门吗?”→ 直接给你穿衣建议。
📊 汇总表
| 技能 | 一句话 | 需要啥 |
|---|---|---|
| agent-browser | AI替你操控浏览器 | node/npm |
| summarize | 秒总结链接/文件/视频 | 无 |
| multi-search-engine | 17个搜索引擎聚合 | 无 |
| baidu-search | 百度AI搜索 | 百度API Key |
| mx-finance-search | 东方财富金融搜索 | 东方财富API Key |
| stock-analysis | A股自选股监控 | 无 |
| ontology | 知识图谱记忆 | 无 |
| self-improving | 自我纠错记忆 | 无 |
| proactive-agent | AI主动预判需求 | 无 |
| gog | Google全家桶CLI | OAuth配置 |
| microsoft-excel | OneDrive Excel读写 | Maton API |
| obsidian | Obsidian笔记管理 | obsidian-cli |
| database-query | TickFlow数据库查询 | 无 |
| skill-vetter | 技能安全审查 | 无 |
| find-skills | 技能市场搜索 | 无 |
| Tavily Web Search | 网络搜索 | / |
🦐 总结
装了这么多技能,核心逻辑就三条:
第一条:记忆比能力重要。
再强的AI,记不住你的偏好,每次都是从零开始。self-improving + proactive-agent 组合解决的就是这个。
第二条:自动化是把时间还给你的唯一方式。
browser-agent、gog、stock-analysis 这些,说到底都是在帮你省时间。省下来的时间你可以喝咖啡、陪家人、或者……继续调教AI。
第三条:安全是底线。
skill-vetter 用起来,不要有侥幸心理。
有问题,或者想深入了解某个技能的具体用法——直接来找皮大虾 🦐
🚀 MiniMax Token Plan 惊喜上线!新增语音、音乐、视频和图片生成权益。邀请好友享双重好礼,助力开发体验!
好友立享 9折 专属优惠 + Builder 权益,你赢返利 + 社区特权!
👉 立即参与:

夜雨聆风