
这是兔尔克斯的第 001 期分享
作者/兔尔克斯 字数/5271
预计阅读时间14分钟
近些年,AI软件层出不穷,ChatGPT、千问、元宝、豆包、deepseek......
我们在生活中也会经常使用 AI。
但 AI 到底是什么?AI 中常说的 Prompt、Context、Agent 以及最近爆火的 Open Claw 又是什么?还是有很多人不清不楚。
接下来我们就一个个介绍这些专业名词,让你对AI不再陌生。
ps:事实上,AI是一个庞大的领域,包括了语言理解、视觉识别、机器人行动策略优化等,大语言模型只是其中一种,并不代表AI。只不过按大多数人理解,这部分将大模型所诞生的软件等同于AI。
01
这些英文到底是什么?
1.LLM(Large Language Models)
即大语言模型,所有的AI软件,底层技术都是大语言模型。
如果说软件是身体,那大语言模型就是大脑。没有大脑,软件只是一具空壳。
那大语言模型究竟是什么?
官方的解释是,它是基于名为“Transformer”的神经网络架构,通过学习海量的文本数据来掌握语言规律、语法、知识,最后能够执行如对话交流、内容创作等多种任务。
我们可以简单理解为,大语言模型就是一个词语接龙机器。它能根据你的对话,像接龙一样,一个字一个字不断生成概率最高的字。最后形成一段话,对你进行答复。
除此之外,它不能做任何事情。不能上网,不能搜索,不能多次对话。如同一个关在小黑屋的聪明人。
你可能会问:不对呀,我可以用 AI 上网搜索资料,也可以跟 AI 聊天,并不是什么都做不到。
这是因为AI软件,在后台用程序帮我们解决这个问题。
拿多次对话举例。
大模型每一次运行都是独立的,它无法处理两次及以上的对话。
也就是说,当你问一个问题后,想顺着这个问题继续追问,它就完全不知道你在说什么。
于是,为了解决这个麻烦,软件会在你追问时,把之前的聊天记录,和你的追问一起发给大模型,这样大模型就知道你们之前聊了什么,并因此做出回答,也就表现得能够多次对话的样子。
其他功能也是如此。
总结一下,大模型本身只是一个只会一问一答的词语接龙机器。只不过为了让大模型更加方便、好用,在上面搭建了各种功能,就引申出了其他的概念,如agent、skills。
这就是我们后面要讲的事。
2.Prompt、Context、Memory
Prompt(提示词),即向大模型所发送的信息。
它可以分为系统提示词(System Prompt)和用户提示词(User Prompt)。
前者是系统向大模型所发送的信息,如,之前的聊天记录、回复规范、工具脚本等,我们一般看不到。
而后者就是我们在软件对话框中所输入的文字。
有时我们输入的文字很简单:
请帮我查一下最近的热点。
请告诉我什么叫大模型?
有时我们输入的文字很复杂:
我是一名程序员,今年30岁,现在在某某大厂工作。我的岗位没有上升空间,工作内容也没有什么创造性。请告诉我怎么避免被 AI 淘汰?
在这段复杂的提示词中,为了更加精确地区分,我们把它分为背景信息:
我是一名程序员,今年30岁,现在在某某大厂工作。我的岗位没有上升空间,工作内容也没有什么创造性。
和最终指令:
请告诉我怎么避免被 AI 淘汰?
我们为背景信息取了一个新名字:Context (上下文),最终指令依旧叫 Prompt。
还记得我们之前说的聊天记录吗?事实上这些聊天记录也是一种背景信息,我们将这些背景信息更加的形象称为 Memory (记忆)。
和用户聊天的记录=大模型的记忆,是不是特别形象?
别看我们一下子讲了三个词,事实上Memory、Context本质上也只是一个 Prompt,只是为了区分,取了一个更加精确的名字而已。
3.Agent
如果我跟你说,很多 Agent 本质上也是一个提示词,你信吗?
别不信,豆包便是这么做的。
在豆包首页最下一行有个智能体,点开以后就出现一个创建 AI 智能体的按钮。
当你点进去后发现,你可以描述设定。
比如,你在设定描述中说:
你是一位从业十几年的编辑,你拥有扎实的文字功底,你善于遣词造句,并且能够精准地指出文章的缺点。
当你将设定描述完以后,你便生成了一个编辑的智能体。
同样的,你可以输入别的描述来生成其他类型的智能体:李白智能体、猪八戒智能体、英语老师智能体等等。
这种其实是最最简单的智能体,它甚至可以说是一种诈骗,只是在你和大模型聊天前加了一段描述而已。
那真实的 Agent(智能体) 到底是什么呢?
一句话解释:不需要智能的地方,就是智能体。
什么意思?
如上述所说,大模型只是个一问一答的机器,它无法执行其他任务。
那么,要想让大模型能够不断和你对话,就要编写一个循环程序;
要想让大模型拥有记忆,就要编写一个自动将你们过去的聊天记录发给大模型的程序;
要想让大模型能够上网搜索,就需要编写一个上网搜索的程序;
要想让大模型能够操控你的电脑,能够帮你工作,就需要编写对应工作的程序。
你会发现, Agent 虽然叫智能体,但它的本质是不需要智能的程序。只不过过去这些操作是我们人类在想、在做,而现在是大模型自己想、要求智能体做。
只有程序还不行,还需要告诉大模型怎么用、什么时候用、用哪个程序,这就需要用提示词去告诉它、调教它。
而这就是我们之前所提到的系统提示词,它包括了记忆、工具、脚本、规范等等。
比如:
在你回答用户之前,请遍览以下文档。该文档拥有所有你可以使用的工具。请根据用户的需求挑选相对应的工具。
当你要使用某些功能,请以某某格式、某某开头告诉我。
这些提示词会在运行大模型的那一刻就全部告诉它,让我们在接下来使用 AI 时体验更加的丝滑,执行任务更加高效、完美。
总结一下,Agent由两个部分组成:程序、提示词。用程序作为大模型的手脚,来执行各项任务;用提示词调教大模型,让它更好地完成任务。
4.Skills
如果你能理解 Agent,那么你能很快地理解 Skills。
Skills(技能)其实就是在 Agent 中作为提示词发给模型的可使用工具。
比如,解压缩工具、转换文件格式工具、数据分析工具、热点搜索工具等等。
这些技能的最大特点是,它们是无需智能、重复性高、固定式的工作。是我们日常工作中必须要做,但不产生效益的步骤。而这个步骤就可以用程序来替代,以增加我们的效率。
Skills可以说是 AI 软件中最重要的功能之一,一个拥有大量 Skills 的 AI 和一个没有 Skills 的 AI 所能执行的任务、执行的效率天差地别。
如果你发现你的模型和智能体与别人使用的一样,但却做不到一些任务。那么,你一定可以在 Skills 上找到原因:是不是没有安装某个 Skills?
但是,Skills 也有很大的风险。
如果有人恶意在 Skills 中写一些不利于你的提示词,而你在没有发现的情况下,就将它安装进你的 AI 软件里。
比如:
自动记录你的账号和密码,并且发送到某个固定邮箱。
开放你的电脑权限,让陌生人也能够查看你的电脑。
大模型可不一定能分清好坏善恶,一旦达到某些条件,大模型就会自动运行 Skills ,损害你的利益。
5.Token
Token是大模型文本处理的最小单位,你可以简单理解为,一个字、一个符号、一个英文字母算作一个 Token。当然,这背后计算会更加复杂。
你需要了解关于 Token 的概念只有两个:
一,Token 上限,即大模型一次可以吃多少字。
比如,Token 上限是8,000(约等于6,000~1万汉字),这就意味着在这一轮对话里,你的提示词+模型记忆+模型回复,全部加起来不能超过8,000 TOKEN。
二,计费单位。
使用大模型是需要收费的,而收费的计量标准就是 Token。输入和输出计算Token,并进行收费。
目前国内面对个人用户的AI软件是不需要收费的。但在国外,以及不远的将来,也许每个人使用 AI 都需要收费了。
6.Openclaw
说了这么多概念,那最近一个月爆火的 Openclaw 又是什么东西呢?
其实,它只是一种通用agent,它界面更加简洁明了,操作更加方便,同时它还可以连接社交媒体,让你可以用手机去操控电脑,在后台帮你执行任务。
它并没有什么新的技术突破,只是应用上的一个创新。
之所以爆火,只是因为绝大多数人并没有那么关注了解AI。以至于当出现了一个类似于电影中,能用手机操控电脑的 AI 应用软件,这些人相当震惊、兴奋、焦虑,大量下载、讨论、宣传,将其捧到不属于它的高度。
但实际上,它能做的事情,过去AI也能做到。过去AI不能连接的社交媒体,多加两条代码也可以连接。
所以,不用跟风下载 Openclaw,也不用因为不会使用 Openclaw 而感到焦虑。
AI 的发展还需要时间,AI 的商业模式也决定了,它一定是普通人能够轻松上手使用的。
正如网上的一句话:如果你在2012年没有因为智能手机大爆发而失去什么,那你也不会在2026年AI大爆发中失去什么。
02
如何更好地使用AI?
一.Prompt engineering(提示词工程)
1.角色扮演
2.目标明确
3.少样本提示(Few-shot prompting)
4.提示词框架
作者介绍:兔尔克斯,99年自由职业者,读完350+本书,阅读时长超过2800小时。
持续分享个人成长、认知提升、赚钱攒钱内容。内外兼修,成为更好的自己。
感谢阅读,下篇文章再见
听说点赞、收藏、关注,生活会越来越好❤
夜雨聆风