今天问豆包,“我中午应该吃什么”? 明天说“豆包我的大孙子为什么还不回来?”,然后你看了看豆包的回复,参考了一下,关闭手机。
表面看着就是你打了几个字,或者是发了个语音。 但是你应该不知道,这短短的一句话发送给豆包之后,背后是什么样的东西在支撑了这个流程的运转。
你天天在用的,叫“大模型”
在我们的上一篇文章中,我们浅聊了一下 “AI” 是什么。
接下来我们主要聊我们日常生活中经常使用到的“豆包”、“deepSeek” 他们可以跟我们进行聊天等等。但是他们具体是叫什么呢? 没错就是 大语言模型 英文名字是 Large Language Model 简称为LLM, 国内一般就是叫做“大模型”。
然后我们拆开来看,大、语言、模型。
大: 大模型在“训练阶段”会需要用到很多很多很多的数据,比如我们在网上看到微博帖子,一些新闻,书籍等等。这些都是大模型的训练数据。
同时他的参数量也是非常大的。 参数就可以理解为是AI的脑子里边的连接点,参数越多,那么他能理解的内容也就越多。比如说,豆包你问他什么他基本都能给你答出来,并且头头是道的。 但是如果这个时候有一个参数量非常小的模型,那么你问他一些专业领域的问题,比如问他金融,法律等等比较专业的问题,他可能就开始答非所问,或者就开始给你”胡扯“了。
就好像之前我为了让我的龙虾不在当”吞金兽“,我在家里自己跑了一个小的模型,然后跟他对话没什么问题,但是我想让他去做一些事情,使用一些工具的时候就开始变“笨”了。
语言:他处理是的是文字,你打字给他,他就回复你文字。就像咱们交流的时候都是说的普通话,我英语不好,你的的英语很厉害,你跟我说英语,我就只会回复你:我不会英语了 (强人所难了哈)。当然现在模型的发展已经非常快速了,也很厉害,有很多的多模态模型,能够处理很多语言,比如图片,视频等等。这个我们后边再聊。
模型: 在我们这个系列的上一篇文章中浅聊了一下, 他就是通过他训练得到的数据,然后来通过这个数据的逻辑,来处理我们输入的内容。 比如我们从小到大我们需要去学习数学才知道 1+1=2,模型也是这样,他通过1+1=2这样的数据知道了这个算术题最终等于2,当你问他的时候,他就知道直接回复2。
所以大模型他不是一个噱头,而是一个实打实能够让大家便利的一个东西。再举一个不是很恰当的例子。 在没有计算器之前我们需要反复的去学习和练习,才能越算越快。 但是计算器的诞生却让了很多人可以不用通过大量的学习和练习就能快速拥有这个能力。 大模型是很聪明的,因为他足够的大,当你给他输入内容很多很详细时,他就会消耗很多的token然后将一个还不错的答卷交给你。
你跟AI 说的每句话,都在消耗“词元”

这是我们今天的主角,“词元”英文名字又叫做token。
比如你问大模型“今天中午我吃什么?” 大模型不是直接理解你这一整句话,而是会把你的话给切成一小块儿, 然后逐个处理,然后拼出答案在返回给你。(你问大模型的问题就是 输入,大模型的回复就是输出)
这每个小块儿,就叫做token(词元),所以模型的输入和输出都是按照token进行计算的。
前段时间,国家数据局局长公开表示:“把token给定义成“词元”,这个是划时代的意义。 并且也不是随便就要给他命名的, 因为现在词元正在变成AI时代的“结算单位”。
现在大模型的厂商,卖服务按词元收费,调用量大就会多花一些。 调用量小,就会少一些。比较形象的说法,就像水电费一样,电费按度计算,水费按吨计算,你使用ai服务则是按token计算。
尤其是近年来,通过国家数据局披露的数据,24年国内日均词元调用量1000亿。25年100w亿。 26年3月就飙升到了140w亿。从这个数据中可以得出,现在的词元已经是一个巨大的市场了。
价格战跟你有啥关系?
咱们前面聊到, 词元是计费单位,那计费价格呢?
之前模型大战的价格战确实很激烈, 拿智谱来说,调用量是 Claude Pro 的 3 倍,定价确实claude 的1/7(虽然这是智谱 普调之前的数据但是也能充分说明国内的价格确实很便宜,现在对标国外也是很便宜)。
比如 OpenAi的codex的其中一个套餐, 基础版 7$一个月,虽然也挺便宜的但是你会看到广告,并且是只有这个套餐会看到广告(有没有想到我们看到的小品,AI正在努力的工作中突然停止工作开始给你插播广告的画面 哈哈哈哈)。
现在的价格确实挺便宜的了。 不过我觉得这个局面不会一直持续下去, 免费的额度,总会用完,价格战也不会一直打下去。 现在我们能够早些知道词元是什么, 最起码以后看到 “xxx 调用量万亿词元”这种新闻的时候,能看懂他在说什么。
搞懂之后, 可以做些什么?
现在我们知道了相关的概念, 我们是不是可以尝试些其他的东西呢?
1. 换个模型试试
平时在用的是什么? 换一个其他的用一用多体验一下,看看他们有什么不同,比如 kimi擅长文档, deepSeek 擅长推理等等。找到一个跟自己工作也好,还是兴趣也好,能够给自己提供很大帮助的那个。
2. 注意提问方式
大模型并不是浏览器,他的特性是你给他输出的越多,描述的越详细,他的回答才会越好。比如你说“帮我写个周报”和我是做市场运营的:1. 完成了Q2营销方案初稿。 2. 跟进了三个客户。 3. 参加了行业的峰会。 这两种交流的方式所得到的结果肯定是天差地别的。
3. 别怕犯错
大模型现在还不完美,但他好用却是真的。与其担心“AI 会不会取代我”, 不如先学会用AI 帮你在工作中节省出半个小时的时间。
token也好,词元也罢,亦或者大模型,都是顺应了时代的一个产物,我们只需要了解他,就像我们刚开始学习使用电脑一样,没有什么难的。
不知道你的身边是否有已经学会用AI的人呢?
关注我,不走弯路,我们下期再见。
END
夜雨聆风