大模型的技术中可能经常听到"Skill",它是做什么用的?能帮助我们做什么?我们怎么才能用到这个技能?
其实,大模型中的"Skill"≈一个"能完成特定任务的小程序"。
想象一下:大模型本身就像一个巨大的操作系统(例如Windows)。操作系统本身很强大,但你要让它帮你“将今天的气温超过30度的城市列出来并且排序”,直接问它,它可能说胡话。
这怎么整?给这个大操作系统装上一个个"小插件"或者"专用工具"。这些"小插件"就叫做Skill(技能)。
大模型相关历史文章,
举个例子
普通大模型:你问“帮我发一封邮件给老王,说今晚吃饭”。它可能只知道生成邮件内容,但没法真的发出去。
装了“发邮件Skill”的大模型:这个Skill就像一个小模块,知道怎么调用你的邮箱API、填收件人、点发送。大模型会说:“好的,我调用‘发邮件技能’帮你发送了。”
为什么大模型需要这种Skill?
因为大模型本质上是一个文本预测器(猜下一个词),它没有手,不能直接操作外部系统——不能真发邮件、不能查数据库、不能打开计算器、不能控制机器人。
所以研究人员给它造了很多Skill,让它可以做这些,

大模型的工作流程变成:用户提问 → 大模型判断要用哪个Skill → 调用那个Skill得到结果 → 整理答案返回。
一个经典例子:Toolformer / ChatGPT插件
Toolformer(Meta 2023年论文)就是让大模型自己学会调用工具(计算器、翻译器等)。这些工具就是Skill。
ChatGPT的插件(Plugin)本质上也是一种Skill。你装一个“订机票插件”,ChatGPT就能帮你订票。
一句话区分
普通说的“大模型的能力”:像写诗、翻译、总结,是模型自己学到的。
大模型技术里说的“Skill”:是专门为模型设计的、可调用的外部工具或子程序,让模型能做它原本做不到的事(例如操作外部系统、精确计算、控制设备)。
所以当你下次看到大模型论文说"我们给模型增加了20个Skills",你可以理解为:"我们给模型装了20个小插件,让它能真正操控现实世界的一些东西了。"
如果您认为这篇文章有些帮助,还请不吝点下文章末尾的"点赞"和"在看",或者直接转发朋友圈,

微信公众号:@bisal的个人杂货铺 腾讯云开发者社区:@bisal的个人杂货铺 头条号:@bisal的个人杂货铺 CSDN:@bisal ITPub:@bisal 墨天轮:@bisal 51CTO:@bisal 小红书:@bisal 抖音:@bisal
夜雨聆风