大模型不是只会聊天 —— Skill插件到底能做些什么?

点击标题下「蓝色微信名」可快速关注

大模型的技术中可能经常听到"Skill"，它是做什么用的？能帮助我们做什么？我们怎么才能用到这个技能？

其实，大模型中的"Skill"≈一个"能完成特定任务的小程序"。

想象一下：大模型本身就像一个巨大的操作系统（例如Windows）。操作系统本身很强大，但你要让它帮你“将今天的气温超过30度的城市列出来并且排序”，直接问它，它可能说胡话。

这怎么整？给这个大操作系统装上一个个"小插件"或者"专用工具"。这些"小插件"就叫做Skill（技能）。

大模型相关历史文章，

《能大米刻字的ChatGPT Images 2.0》

《OpenClaw：你养的是虾还是被时代落下的恐惧？》

举个例子

普通大模型：你问“帮我发一封邮件给老王，说今晚吃饭”。它可能只知道生成邮件内容，但没法真的发出去。
装了“发邮件Skill”的大模型：这个Skill就像一个小模块，知道怎么调用你的邮箱API、填收件人、点发送。大模型会说：“好的，我调用‘发邮件技能’帮你发送了。”

为什么大模型需要这种Skill？

因为大模型本质上是一个文本预测器（猜下一个词），它没有手，不能直接操作外部系统——不能真发邮件、不能查数据库、不能打开计算器、不能控制机器人。

所以研究人员给它造了很多Skill，让它可以做这些，

大模型的工作流程变成：用户提问 → 大模型判断要用哪个Skill → 调用那个Skill得到结果 → 整理答案返回。

一个经典例子：Toolformer / ChatGPT插件

Toolformer（Meta 2023年论文）就是让大模型自己学会调用工具（计算器、翻译器等）。这些工具就是Skill。
ChatGPT的插件（Plugin）本质上也是一种Skill。你装一个“订机票插件”，ChatGPT就能帮你订票。

一句话区分

普通说的“大模型的能力”：像写诗、翻译、总结，是模型自己学到的。
大模型技术里说的“Skill”：是专门为模型设计的、可调用的外部工具或子程序，让模型能做它原本做不到的事（例如操作外部系统、精确计算、控制设备）。

所以当你下次看到大模型论文说"我们给模型增加了20个Skills"，你可以理解为："我们给模型装了20个小插件，让它能真正操控现实世界的一些东西了。"

如果您认为这篇文章有些帮助，还请不吝点下文章末尾的"点赞"和"在看"，或者直接转发朋友圈，

可以到各大平台找我，

微信公众号：@bisal的个人杂货铺
腾讯云开发者社区：@bisal的个人杂货铺
头条号：@bisal的个人杂货铺
CSDN：@bisal
ITPub：@bisal
墨天轮：@bisal
51CTO：@bisal
小红书：@bisal
抖音：@bisal

近期更新的文章：

《坚持》

《这就是中国兵乓的精神》

《你知道127.0.0.2做什么的？》

《英超第三十五轮》

《长江后浪推前浪》

近期Vlog：

《千岛湖》

《Skyline Luge》

《新疆之行（红山体育馆 - 国际大巴扎 - 红山公园 - 天山天池）》

《新疆之行（天马浴河 - 哈因塞 - 那拉提 - 依提根塞）》

《新疆之行（六星街 - 伊昭公路 - 夏塔）》

热文鉴赏：

《揭开"仿宋"和"仿宋_GB2312"的神秘面纱》

《Linux的"aarch"是多了个"a"？》

《中国队“自己的”世界杯》

《你不知道的C罗-Siu庆祝动作》

《大阪环球影城避坑指南和功略》

《推荐一篇Oracle RAC Cache Fusion的经典论文》

《"红警"游戏开源代码带给我们的震撼》

文章分类和索引：

《公众号2000篇文章分类和索引》