阅读量一夜破万的秘密:别人还在调 API,你已经开始写「AI 原生应用」了。
你早上起床,对着手机说:「帮我查一下今天的天气,然后根据天气推荐穿什么衣服,顺便把今天的待办事项整理成清单发给我。」你的 AI 助手不仅做了所有这些,还自动帮你预约了今天下午的会议,因为它记住了你昨天邮件里提到的deadline。这不是科幻。这是2026 年的 AI Agent 现实,而构建这一切的底层能力,就是今天我要重点讲的OpenClaw Skill。2026 年初,OpenClaw 在 GitHub 上狂揽16.3 万星,成为 AI 开源领域最耀眼的新星。黄仁勋在英伟达 GTC 大会上直接将其比作「AI 时代的 Windows」,国内大厂一周内密集推出十余款类 OpenClaw 产品——这场变革的核心,正是其独特的Skill 机制。如果你还只会调用 API、写 Prompt,那这篇文章将带你进入一个全新的维度:像写 App 一样,给 AI 写技能插件。
一、Skill 是什么?为什么它是 AI 时代的 App Store?
在说 Skill 之前,先问一个根本问题:大模型本身有什么局限?1. 它没有「手」—— 它能告诉你怎么做,但不能真的去执行,比如读写文件、发送邮件、控制智能家居。2. 它没有「记忆」—— 每次对话都是全新的上下文,你问过的关键信息它下次不一定记得。3. 它不知道你的业务—— 通用的 LLM 不了解你公司的产品、用户、数据结构。OpenClaw 的Skill 机制,就是为了解决这三个问题而生的。Skill(技能)是 OpenClaw 的核心扩展单元。你可以把它理解为:>一个 Skill = 一套工具 + 配套指令 + 调用逻辑的完整封装它有点像是 Chrome 插件、VS Code 扩展,或者——用更形象的比喻——AI Agent 的「APP」。当你给 OpenClaw 安装了一个「PDF 解析」Skill,它就突然拥有了读懂 PDF 的能力;安装了一个「飞书推送」Skill,它就学会给你发飞书消息;安装了一个「股票查询」Skill,它就能实时查询股价。这就是 Skill 的魅力:你不需要写代码去改造大模型本身,只需要「教会」它用新工具。Skill vs Plugin vs Tool:有什么区别?很多人会把 Skill 和 Plugin、Tool 搞混,这里做一个快速辨析: | | |
|---|
| Tool(工具) | | |
| Plugin(插件) | | |
| Skill(技能) | | |
简单来说:Skill 是最高维度的抽象。一个 Skill 内部可能包含多个 Tool,它本身还自带使用说明(SKILL.md),自己知道什么时候该被调用、该怎么调用。
二、Skill 的核心结构:拆开看看到底有什么
SKILL.md 是 Skill 的核心规范文件,它告诉 OpenClaw 三件事:这个 Skill 是什么、能做什么、什么时候该用?description: 技能的简短描述,OpenClaw 根据这个决定何时调用此 Skill我的第一个 Skill
功能说明
使用场景
工具列表
注意事项
SKILL.md 的 description 字段尤为关键——当用户发送一条消息时,OpenClaw 的调度系统会根据 Skill 描述的语义匹配度,决定把任务分发给哪个 Skill。写得越精准,调用越准确。工具脚本放在 scripts/ 目录下,支持多种语言:每个脚本通过标准输入/输出与 OpenClaw 通信,格式通常是 JSON。举一个最简单的例子——一个「天气查询」Skill 的 Python 工具:#!/usr/bin/env python3import sysimport jsondef get_weather(city):
这里调用天气 API
return {"city": city, "temp": "22°C", "weather": "晴"}if __name__ == "__main__":try:args = json.loads(sys.argv[1])city = args.get("city", "北京")result = get_weather(city)print(json.dumps(result, ensure_ascii=False))except Exception as e:print(json.dumps({"error": str(e)}))
OpenClaw 会自动把这个脚本包装成一个可调用的工具,大模型只需要说「帮我查一下上海的天气」,它就知道该调用这个脚本。
三、实战:从零创建一个 PDF 解析 Skill
光说不练假把式。现在我们手把手创建一个完整的 PDF 解析 Skill。mkdir -p my-pdf-skill/scriptscd my-pdf-skill
---name: pdf-parserdescription: PDF 文件解析与内容提取。当用户提到 PDF、文件解析、读取 PDF 内容、提取 PDF 文字时触发。支持读取中文文档、表格提取、关键信息定位等功能。---
PDF 解析技能
技能简介
本技能可以将 PDF 文件解析为结构化文本,支持中英文混合内容、表格识别和关键信息提取。核心工具
pdf_read
**参数:**- `path`: PDF 文件路径(必填)- `pages`: 要读取的页码范围,可选(如 "1-3" 表示前3页)**返回值:**- `text`: PDF 文本内容- `page_count`: 总页数- `success`: 是否成功
pdf_summary
**参数:**- `text`: PDF 文本内容- `max_length`: 摘要最大字数(默认300)
使用示例
用户:「帮我读取一下这份合同.pdf」→ 调用 pdf_read,提取合同全文用户:「这份报告主要说了什么?」→ 调用 pdf_summary,生成摘要
注意事项
- 支持 .pdf 文件格式- 扫描版 PDF(图片型)需要 OCR 支持- 单次解析建议不超过 50 页
#!/usr/bin/env python3import sysimport jsonimport osdef read_pdf(path, pages=None):"""读取 PDF 文件"""if not os.path.exists(path):return {"success": False, "error": "文件不存在"}try:
这里使用 pypdf 或 pdfplumber
import pypdfreader = pypdf.PdfReader(path)page_count = len(reader.pages)start_page = 0end_page = page_countif pages:
处理页码范围 "1-3"
parts = pages.split("-")start_page = int(parts[0]) - 1if len(parts) > 1:end_page = int(parts[1])text = ""for i in range(start_page, min(end_page, page_count)):text += reader.pages[i].extract_text() + "\n\n"return {"success": True,"text": text.strip(),"page_count": page_count}except Exception as e:return {"success": False, "error": str(e)}def summarize_pdf(text, max_length=300):
简化版:取前 N 个字符
iflen(text) <= max_length:return {"summary": text, "source": "全文"}
取前两段作为摘要
paragraphs = text.split("\n\n")summary = ""for p in paragraphs:iflen(summary) + len(p) <= max_length:summary += p + "\n\n"else:breakreturn {"summary": summary.strip(), "source": "前段摘要"}if __name__ == "__main__":args = json.loads(sys.argv[1])tool = args.get("tool")if tool == "pdf_read":result = read_pdf(args.get("path"), args.get("pages"))elif tool == "pdf_summary":result = summarize_pdf(args.get("text"), args.get("max_length", 300))else:result = {"error": "未知工具"}print(json.dumps(result, ensure_ascii=False))
把创建好的 Skill 放到 OpenClaw 的 skills 目录下:cp -r my-pdf-skill ~/.qclaw/skills/
然后在 OpenClaw 中说:「帮我读取一下这份年度报告.pdf」,你的 Skill 就会被自动调用了!
四、Skill 生态现状:现在有哪些好用的 Skill?
截至 2026 年 4 月,OpenClaw 的 Skill 生态正在快速扩张,以下是几个值得关注的方向:Word/Excel 联动:读写 Office 文档一个有意思的数据:根据最新搜索结果,有开发团队用 OpenClaw 的 Skill 机制,一个人配了1 个编排者 + 5 个专业 Agent + 6 类 ACP 编码专家(最大 6 并发)、52 个 cron 定时任务、118 个 Skills(33 全局共享 + 85 Agent 专属),每天几千次 LLM 调用——这基本上是一个小型 AI 公司的运作规模了。
五、为什么说 Skill 是 AI 时代的 App Store?
回顾历史,每一次计算平台的迁移,都会诞生新的应用分发模式:PC 时代 → Windows 应用商店(软件包分发)手机时代 → App Store / 安卓市场(移动应用)AI 时代 → Skill 市场(AI 能力插件)Skill 的 App Store 模式有几个根本性优势:不需要学机器学习、不需要训练模型,只需要理解业务逻辑、写好 SKILL.md 描述和工具脚本,一个产品经理就能给 AI 扩展新能力。多个 Skill 可以无缝协作——PDF 解析 Skill + 翻译 Skill + 飞书推送 Skill,自动组合成一个「外文文献翻译推送」流水线。好的 Skill 设计与底层模型解耦。你可以在 OpenClaw 用,换到别的 Agent 平台,换一套 SKILL.md 适配层又能跑。Skill 可以收费、分成。一个高质量的垂直行业 Skill(比如「法律合同审查」「医疗影像解读」),有明确的付费场景和用户需求。
写在最后
OpenClaw 的 Skill 机制,代表了 AI 应用开发的一次范式转移:从「调 API」到「写技能」,从「用 AI」到「教 AI」,从「单点能力」到「生态协同」。写 Skill,本质上是在教 AI 怎么用工具——这件事的门槛,正在被 OpenClaw 不断降低。如果你是一个产品经理,你可以写一个「竞品分析」Skill,让 AI 自动抓取数据、生成报告。如果你是一个运营,你可以写一个「小红书爆款分析」Skill,自动拆解爆款逻辑、批量生成文案。如果你是一个开发者,你可以把多年积累的工具函数封装成 Skill,让 AI 调用你熟悉的一切。