之前我们用餐厅的故事理解了OpenClaw、大模型、Agent的关系。但Skill(技能)到底是什么?它在实际任务中是怎么工作的?今天通过三个真实场景,让你彻底搞懂。

在OpenClaw的世界里,Skill(技能)就是Agent的”工具箱”。
想象你是一个装修工人:
•大模型=你的大脑(知道怎么装修、有什么步骤)
•Agent=你自己(能动手干活的人)
•Skill=你的工具箱(电钻、锤子、尺子、水平仪…)
•OpenClaw=包工头(分配任务、协调资源)
没有工具,再聪明的大脑也干不了活。Skill就是让Agent真正能”做事”的关键。
任务背景
小王是一家互联网公司的产品经理。周五下午开了一场2小时的项目评审会,会上讨论了3个新功能的开发计划、排期和负责人。会后,老板让小王整理会议纪要,周一发给项目组。
传统做法:
1.花2小时重听录音
2.边听边记,整理成文档
3.再花1小时提炼重点、提取待办
4.最后发邮件
总计耗时:3-4小时
用OpenClaw:
小王在WhatsApp上对OpenClaw说:
“把今天的项目评审会录音整理一下,生成会议纪要,提取待办事项,然后发给项目组”
OpenClaw收到消息后,开始分析这个任务需要哪些Skill:
任务拆解:
├──需要处理音频文件→需要audio_transcribeSkill
├──需要提炼重点→需要text_summarizeSkill
├──需要提取待办→需要todo_extractSkill
Skill 1:audio__transcribe(音频转文字)
作用:把录音转成文字
类比:就像一个速记员,把2小时的会议内容一字不漏地记下来
执行过程:
输入:meeting_20250314.mp3(2小时录音)
↓
audio_transcribeSkill开始工作
↓
输出:transcript.txt(8000字完整文字稿)
技术原理:
•Skill调用语音识别API(如Whisper)
•将音频流分段发送给模型
•模型返回识别结果,Skill拼接成完整文本
Skill 2:text__summarize(文本摘要)
作用:从8000字中提取核心内容
类比:就像秘书读完全部记录,帮你提炼出“会议讨论了哪几件事、结论是什么”
执行过程:
输入:transcript.txt(8000字)
↓
text_summarizeSkill开始工作
↓
Agent调用大模型:"请总结这份会议记录的核心内容"
↓
大模型分析后返回摘要
↓
输出:summary.md(500字会议纪要)
生成的会议纪要示例:
**时间**:2025年3月14日 14:00-16:00
**参会人员**:产品部、技术部、设计部
## 会议议题
### 1. 用户反馈系统优化
- **结论**:同意开发,优先级P1
- **负责 **:张三
- **排期**:3 月20日-4月5日
###2. 支付流程简化
- **结论**:需要进一步调研,暂缓开发
- **负责人**:李四
- **下一步**:3月25日前提交调研报告
### 3. 首页改版
- **结论 **:采用方案B
- **负责人 **:王五
- **排期 **:4月1日启动
Skill 3:todo__extract(待办提取)
作用:从会议纪要中提取具体的待办任务
类比:就像任务管理员,把“谁要在什么时候做什么”列成清单
执行过程:
输入:summary.md(会议纪要)
↓
todo_extractSkill开始工作
↓
Agent调用大模型:"请提取这份纪要中的所有待办事项"
↓
大模型识别出所有任务项
↓
输出:todo_list.json
生成的待办列表示例:
[
{
“任务":“用户反馈系统开发",
“负责人":“张三",
“截止日期":“2025-04-05","
优先级":“P1"
},
{
“任务":"支付流程调研报告",“负责人":"李四",
“截止日期":“2025-03-25",“优先级":"P2"
},
{
“任务":“首页改版方案细化",“负责人":"王五",
“截止日期":“2025-04-01",“优先级":“P1"
}
]
Skill 4:send__email(发送邮件
作用:把内容整理好发给项目组
类比:就像前台帮你把文件打包、写好收件人、寄出去
执行过程:
输入:summary.md+todo_list.json+收件人列表
↓
send_email Skill 开始工作
↓
调用邮件服务 API
↓
输出:邮件发送成功
最终发送的邮件:
收件人:product-team@company.com
主题:【会议纪要】3月14日项目评审会
各位同事:
附件是本次项目评审会的会议纪要和待办事项,请查收。
待办事项概览:
1.【P1】用户反馈系统开发-张三-4月5日前
2.【P2】支付流程调研报告-李四-3月25日前
3.【P1】首页改版方案细化-王五-4月1日前
如有疑问请随时沟通。
整个过程耗时
人工处理:3-4小时
OpenClaw 处理:5-10 分钟二
任务背景
小李是一位科技博主,写了一篇3000字的深度文章《2025年AI发展趋势分析》。现在他想把这篇文章改写成适合不同平台发布的内容:
•小红书:简短、有emoji、口语化
•微博:140字精华+话题标签
•公众号:保持深度,但优化排版
传统做法:
1.自己读一遍文章,理解核心观点
2.针对每个平台特点,手动改写3个版本
3.调整格式、添加配图建议
总计耗时:3-4小时
用OpenClaw:
小王在Telegram上对OpenClaw说:
“帮我把这篇关于 AI 发展趋势的长文章,改写成适合小红书、微博、公众号三个平台的内容,文件在桌面上的ai_trends_2025.docx”
Skill 1:read_file(读取文件)
作用:从电脑上读取文章文件
类比:就像助理去你桌上把文件拿过来
执行过程:
输入:文件路径 ~/Desktop/ai_trends_2025.docx
↓
read_file Skill 开始工作
↓
读取文件内容
↓
输出:article_content (3000 字原文)
技术原理:
•Skill调用文件系统API
•读取.docx文件并解析内容
•将内容返回给Agent
Skill 2:content__analyze(内容分析)
作用:分析文章的核心观点和结构
类比:就像编辑审稿,先理解文章讲了什么、有哪些重点
执行过程:
输入:article_content(3000字)
↓
content_analyzeSkill开始工作
↓
Agent调用大模型:"请分析这篇文章的核心观点、关键数据、主要结论"
↓
大模型返回分析结果
↓
输出:content_analysis.json
分析结果示例:
{
“标题":"2025年AI发展趋势分析",
“核心观点":[
“大模型将向多模态方向发展",
“AIAgent将成为新的交互入口","垂直领域AI应用将爆发"
],
“关键数据":[
“2025年全球AI市场规模预计达5000亿美元","多模态模型参数规模增长10倍"
],
“主要结论":"AI正从工具向助手演进"}
Skill 3:style_rewrite(风格改写)
作用:根据不同平台特点,改写3个版本
类比:就像有3个文案改写员,分别擅长不同平台的风格
执行过程:
输入:content_analysis.json+平台要求
↓
style_rewriteSkill开始工作(执行3次)
↓
Agent调用大模型:"请按小红书风格改写..."
Agent调用大模型:"请按微博风格改写..."
Agent调用大模型:"请按公众号风格改写..."
↓
输出:3个平台的内容版本
小红书版:
姐妹们!2025年AI发展真的太猛了
三大趋势必看:
1.多模态AI来了!文字+图片+视频一次搞定
2.AI Agent成新入口,以后不用打开一堆App了
3.垂直领域爆发,医疗/教育/金融都有专属AI
市场规模要破5000亿美元!
微博版:
【2025年AI发展趋势:从工具到助手】核心观点:
•多模态大模型成为主流
•AIAgent重塑交互方式
•垂直应用迎来爆发期
市场规模预计达5000亿美元,AI正从“工具"向“助手"演进。
公众号版:
#2025年AI发展趋势分析:从工具到助手的范式转移
##一、多模态成为标配
2025年,单一文本模型将让位于多模态模型...
##二、AIAgent崛起
Agent将成为新的交互入口,用户只需告诉AI"我要做什么"...
##三、垂直领域爆发
通用大模型+领域知识=专业AI助手...
---
**数据来源**:Gartner、麦肯锡研究报告
**作者**:小李
Skill 4:format__output(格式输出)作用
作用:整理成可直接使用的格式
类比:就像排版设计师,把内容排得整整齐齐
执行过程:
输入:3个平台的内容版本
↓
format_outputSkill开始工作
↓
按平台要求格式化
↓
输出:formatted_content.md
最终输出文件:
##小红书
(内容+配图建议:科技感背景图+数据可视化)
##微博
(内容+配图建议:信息图)
##公众号
(内容+排版标记+配图建议)
整个过程耗时
人工处理:2-3小时
OpenClaw 处理:3-5分钟二
任务背景
小张想周六带家人去郊区玩,家里有:
•2位老人(60多岁,不能走太多路)
•1个5岁小孩
•预算控制在500元以内
传统做法:
1.打开地图搜景点
2.打开大众点评搜餐厅
3.一个个看评价、比价
4.手动规划路线
5.计算预算
总计耗时:1-2小时
用OpenClaw:
小王在微信上对OpenClaw说:
“这周六想带家人去郊区玩,有两个老人和一个5岁小孩,帮我规划一下路线、推荐餐厅,预算控制在500元以内”
Skill 1:map_search(地图搜索)
作用:搜索适合家庭出游的景点
类比:就像导航软件,帮你找附近的好地方
执行过程:
输入:搜索条件(郊区、适合老人小孩、周六开放)
↓
map_search Skill 开始工作
↓
调用地图 API 搜索景点
↓
输出:景点列表
搜索结果示例:
[
{
”名称”: “青龙湖公园”,
“距离": "25 公里",
“特点": “有环湖步道、儿童游乐区、可野餐”
“适合老人” “是(有观光车)”,
“适合小孩”: “是(有游乐场)”,
Kimi.ai 生成
“门票”: “免费”
},
{
“名称”: “古北水镇”,
“距离”: “80 公里”,
“特点”: “古镇风光、美食街”,
“适合老人”: “是(可坐船)”,
“适合小孩”: “一般”,
“门票”: "140 元/人”
}
]
Skill 2:restaurant_query(餐厅查询)
作用:搜索景点附近的餐厅
类比:就像大众点评,帮你找好吃的
执行过程:
输入:青龙湖公园 + 搜索条件(适合家庭、人均 100 以内)
↓
restaurant_query Skill 开始工作
↓
调用餐厅搜索 API
↓
输出:餐厅列表
搜索结果示例:
[
{
“ 名称”: “ 湖畔农家乐”,
“ 距离景点”: “500米”
“ 人均”: “60元”,
“ 特色”: “ 农家菜、有包间”,
“ 评分”: “4.5”,
“ 适合家庭”: “ 是”
},
{
“ 名称”: “ 青龙湖鱼庄”
“ 距离景点”: “1公里”,
“ 人均”: “80元”,
“ 特色”: “ 湖鲜、环境好”,
“ 评分”: “4.7”,
“ 适合家庭”: “ 是”
}
]
Skill 3:price__compare(价格比较)
作用:计算不同方案的费用
类比:就像比价助手,帮你算清楚要花多少钱
执行过程:
输入:景点门票+餐厅人均+交通费
↓
price_compareSkill开始工作
↓
计算总预算
↓
输出:费用明细
费用计算结果:
方案一:青龙湖公园+湖畔农家乐
├──门票:0元(免费)
├──午餐:60元×5人=300元
├──交通:油费约50元
└──总计:350元(符合预算)
方案二:古北水镇+古镇餐厅
├──门票:140元×5人=700元
├──午餐:80元×5人=400元
├──交通:油费约100元
└──总计:1200元(超出预算)
Skill 4:itinerary__plan(行程规划)
作用:生成完整的行程安排
类比:就像旅行规划师,帮你安排一整天的行程
执行过程:
输入:景点信息+餐厅信息+预算+家庭成员情况
↓
itinerary_planSkill开始工作
↓
Agent调用大模型:"请根据这些信息生成详细行程"
↓
大模型生成完整行程
↓
输出:itinerary.md
生成的形成安排:
##基本信息
-**日期**:本周六
-**人数**:5人(2老人+2成人+1小孩)
-**预算**:500元以内
-**实际花费**:约350元
## 行程安排
### 09:00 出发
- 自驾前往青龙湖公园(约 40 分钟)
- 提醒:给老人准备折叠椅
### 10:00-12:00 游玩青龙湖公园
- 推荐路线:
1. 正门入园 → 坐观光车环湖(老人省力)
2. 儿童游乐区(小孩玩 30 分钟)
3. 湖边草坪野餐休息
- 注意事项:
- 给小孩带防晒帽
- 老人走累了随时休息
### 12:30-14:00 午餐
- ** 餐厅 **:湖畔农家乐
- ** 地址 **:公园东门 500 米
- ** 推荐菜 **:
- 农家小炒肉(招牌)
- 清蒸鱼(适合老人)
- 蔬菜沙拉(清淡)
- ** 预计花费 **:300 元
### 14:30-16:00 下午活动
- 湖边散步拍照
- 小孩可在沙坑玩耍
- 老人可在凉亭休息
### 16:30 返程
- 避开晚高峰
## 物品清单
- [ ] 身份证
- [ ] 老人常用药品
- [ ] 小孩零食
- [ ] 防晒霜
- [ ] 折叠椅
- [ ] 充电宝
## 紧急联系
- 公园客服:010-12345678
- 餐厅电话:010-87654321
整个过程耗时
人工处理:1-2小时
OpenClaw 处理:2-3分钟二

总结:Skill到底是什么?
通过三个场景,我们可以这样理解Skill:
Skill的本质
Skill=封装好的”能力模块”
每个Skill都是一段代码,它知道:
1.能做什么(功能定义)
2.需要什么输入(参数要求)
3.会产生什么输出(返回结果)
4.怎么调用外部服务(API调用)
Skill的本质
类型 | 例子 | 说明 |
文件操作类 网络请求类 | read__file,write__file map__search,restaurant__query | 读写电脑上的文件 调用外部API获取数据 |
AI能力类 | text__summarize,style__rewrite | 调用大模型进行智能处理 |
通信类 | send__email,send__message | 发送邮件或消息 |
计算类 | price__compare,data__analysis | 进行数据计算和分析 |
Skill的工作流程
用户输入
↓
Agent理解任务
↓
判断需要哪些Skill
↓
依次调用Skill
↓
Skill执行具体操作
↓
返回结果给Agent
↓
Agent整合结果
↓
输出最终答案
一句话记住Skill
Skill 是 Agent 的“手脚”,让 Agent 从“只会说” 变成“ 真能干”

常见问题Q&A
Q1:Skill是谁提供的?
A:Skill可以由OpenClaw官方提供(内置Skill),也可以由开发者自己编写(自定义Skill)。就像手机App,有系统自带的,也可以从应用商店下载。
Q2:我可以自己写Skill吗?
A:可以!Skill本质上是一段代码,只要按照OpenClaw的规范编写,定义好输入输出,就可以被Agent调用。
Q3:一个任务可以用多个Skill吗?
A:当然可以!上面的三个场景都用了4个Skill。复杂的任务可能需要十几个Skill协同工作。
Q4:Skill和大模型是什么关系?
A:Skill是”工具”,大模型是”大脑”。有些Skill直接调用外部API(如地图搜索),有些Skill需要调用大模型(如文本摘要)。大模型帮助Skill理解任务、生成内容,但具体执行还是靠Skill。
希望这三个场景能帮你真正理解Skill是什么。
如果你有任何问题,欢迎留言讨论!

夜雨聆风