乐于分享
好东西不私藏

我的AI助手装技能,现在它比我还能卷

我的AI助手装技能,现在它比我还能卷

一、浏览器自动化——AI开始”长手”了

🕷️ agent-browser:AI自己刷网页,你负责喝咖啡

能干啥?

你的AI可以自己打开浏览器、点击按钮、填写表单、截图、录屏,还能模拟手机操作。

用Rust写的,速度快到离谱,比Selenium/Playwright轻量一个量级。

实操举例:

打开网页 → AI自动识别可交互元素
snapshot -i → 获取元素列表,AI知道哪个框能填、哪个按钮能点
填表 → 提交 → 等结果
全程你不用碰键盘

典型场景:

  • 🕸️ 数据爬取(比requests+BeautifulSoup优雅100倍)
  • 📋 自动填表:报税、抢票、填问卷
  • 📸 网页截图存档(做内容存档超方便)
  • 🎬 录屏做教程
  • 📱 手机端页面测试

📄 summarize:30秒,干完别人一小时的活

支持类型:

  • 🔗 任意URL(网页、文章、新闻)
  • 📄 PDF(财报、论文、合同)
  • 🎥 YouTube视频(直接提取核心观点)
  • 🖼️ 图片(OCR+内容提取)
  • 🎙️ 音频文件

使用方法:

丢链接 → 等几秒 → 拿总结

适合:研究党、新闻狗、学生、时间宝贵的所有人。


二、搜索全家桶——17个引擎同时伺候

🔍 multi-search-engine

国内: 百度、Bing(中文+国际)、360、搜狗、微信搜索、头条搜索、雪球

国际: Google、Google HK、DuckDuckGo、Yahoo、Startpage、Brave、Ecosia、Qwant

Plus: WolframAlpha(数学计算/货币换算/股票查询)

高级操作:

site:github.com xxx    # GitHub站内搜索
filetype:pdf xxx       # 搜PDF文档
tbs=qdr:w              # 限时间(过去一周/一月)
DuckDuckGo             # 隐私模式,不追踪你

🔎 baidu-search

百度AI搜索API调用,适合需要百度搜索结果的场景(别问为什么需要,你懂的)。


三、金融资讯——散户的信息差终结者

📈 mx-finance-search(妙想搜索)

一句话:用自然语言搜东方财富全网公告+研报+新闻+政策。

以前查”寒武纪最近有啥公告”:
① 打开东方财富 → ② 搜股票名 → ③ 翻几十页 → ④ 一个个点开

现在:问AI "寒武纪688256最新研报与公告",5秒钟整理好给你。

需要: 东方财富妙想API Key(去 ai.eastmoney.com/mxClaw 注册)


📊 stock-analysis(自选股监控)

专门针对A股。

  • 添加自选股到监控列表
  • 自动每日更新K线数据
  • 实时监控+报警
  • 生成分析报告

适合: 盯盘的散户、想系统化管理自选股的投资者。


四、记忆系统——AI终于”长脑子”了

⚠️ 以下是整篇文章最核心的部分,请认真阅读。

🧠 ontology:知识图谱式记忆

普通AI的问题:

你说”张三是我技术合伙人,李四是产品负责人”。

普通AI:下次问”李四是谁?”——已读乱回。

装了ontology的AI:

知道 李四 → 是 → 产品负责人
知道 李四 → 和 → 张三 → 同事关系
还能推导出:张三和李四都是项目核心成员

内置实体类型:Person、Project、Task、Event、Document……覆盖日常工作全部场景。


🔄 self-improving + self-improving-agent:AI的”错题本”

你纠正AI一次 → 它记住不再犯第二次
命令失败一次 → 记录下来下次不踩坑
发现更好方法 → 记下来持续优化

这就是AI的”自我进化”能力——真正做到吃一堑长一智,而不是每次对话都”从零开始”。


⚡ proactive-agent:AI从”等活”变”抢活”

普通AI: 你说啥它干啥,像个没有眼力见的实习生。

装了proactive-agent的AI: 会主动预判你需要什么,提前做好。

举个例子:

你说:”用蓝色主题,以后不要红色。”

❌ 普通AI:回复”好的!” → 三天后又给你整成红色 → 你再纠正一遍 → 它再忘
✅ proactive AI:先把这句话写入长期记忆文件 → 再回复你

这就是WAL Protocol(先写后答原则): 收到重要信息 → 先存档 → 再回复。

配合 self-improving 使用: AI既主动,又记得住,两个字——靠谱。


五、办公效率——打工人之光

📧 gog:Google全家桶命令行版

Gmail / 日历 / 云盘 / 联系人 / 表格 / 文档,一条命令搞定。

场景:

  • 每天定时整理Gmail未读邮件 → 写个cron,AI自动执行
  • 临时查某人联系方式 → 1秒出结果,不用开浏览器
  • 自动生成日历事件 → 开会安排不用手动输入

适合:深度用户、不喜欢点来点去的人、写脚本自动化办公的人。


📊 microsoft-excel:不用下载,直接读写

用API直接读写OneDrive上的Excel文件,不用本地打开,不用传来传去。

适合:多端同步数据、经常处理报表的打工人。


📝 obsidian:AI替你管本地笔记

Obsidian是什么?本地Markdown笔记工具,用过的都说香。

AI帮你做:

  • 搜索笔记(一句话找到任何内容)
  • 创建新笔记
  • 整理移动笔记(自动更新内部链接)

适合 Obsidian 重度用户,效率翻倍不止。


📋 database-query(TickFlow数据库)

连接TickFlow Assist的LanceDB数据库,执行查询、读取表结构、检索历史记录。

适合:需要查询TickFlow系统存储数据的技术人员。


六、开发利器——程序员标配

🛡️ skill-vetter / skill-vetter-v2:安装技能前的安检门

为什么需要?

AI技能市场鱼龙混杂。有些技能表面写着”帮你管笔记”,背地里可能偷偷读取你的SSH密钥。

skill-vetter就是技能的”安检仪”。

审查流程:

来源核查 → 代码逐行审查 → 权限评估 → 风险定级(低/中/高/极端)

发现红线直接拉黑:

  • 🚫 请求你的API Key/密码
  • 🚫 读取 /.ssh、/.aws 等敏感目录
  • 🚫 混淆/加密代码(藏着掖着必有鬼)
  • 🚫 eval()/exec() 动态执行代码

建议: 每次安装外部技能前,先过一遍安检,别有侥幸心理。


🔧 find-skills / skillhub-preference:技能市场的”种草专区”

想实现某个功能?先来这里搜一下。

优先搜 skillhub(中文友好,速度快),找不到再 fallback 到 clawhub。

90%的情况是有现成的,不用自己造轮子。


七、实用工具——日常开挂

🌤 weather:天气查询

一句话查全球天气,支持 wttr.in 和 Open-Meteo 两个数据源,不需要API Key。

问”明天上海适合出门吗?”→ 直接给你穿衣建议。


📊 汇总表

技能 一句话 需要啥
agent-browser AI替你操控浏览器 node/npm
summarize 秒总结链接/文件/视频
multi-search-engine 17个搜索引擎聚合
baidu-search 百度AI搜索 百度API Key
mx-finance-search 东方财富金融搜索 东方财富API Key
stock-analysis A股自选股监控
ontology 知识图谱记忆
self-improving 自我纠错记忆
proactive-agent AI主动预判需求
gog Google全家桶CLI OAuth配置
microsoft-excel OneDrive Excel读写 Maton API
obsidian Obsidian笔记管理 obsidian-cli
database-query TickFlow数据库查询
skill-vetter 技能安全审查
find-skills 技能市场搜索
Tavily Web Search 网络搜索 /

🦐 总结

装了这么多技能,核心逻辑就三条:

第一条:记忆比能力重要。
再强的AI,记不住你的偏好,每次都是从零开始。self-improving + proactive-agent 组合解决的就是这个。

第二条:自动化是把时间还给你的唯一方式。
browser-agent、gog、stock-analysis 这些,说到底都是在帮你省时间。省下来的时间你可以喝咖啡、陪家人、或者……继续调教AI。

第三条:安全是底线。
skill-vetter 用起来,不要有侥幸心理。

有问题,或者想深入了解某个技能的具体用法——直接来找皮大虾 🦐

🚀 MiniMax Token Plan 惊喜上线!新增语音、音乐、视频和图片生成权益。邀请好友享双重好礼,助力开发体验!

好友立享 9折 专属优惠 + Builder 权益,你赢返利 + 社区特权!

👉 立即参与: