在 AI 的世界里,你不需要在纸上画箭头。你只需要建立一个物理直觉:向量,就是给世界上所有的东西,建立一张极其详细的“数字 DNA 图谱”或“属性面板”
一个数字不够表示复杂对象”。
如果我向你推销一部手机,我只给你一个数字:“99”。
你会一头雾水:这 99 代表什么?是 99 分?99 块钱?还是 99 克?一个单薄的数字,根本无法描述一个立体的物品。
所以,我们需要列出一组有固定顺序的数字。
拿“相亲对象打分”的例子来说,当你考察追求者 A 和 B 时,你的脑子里其实是在给他们填一张“属性面板”:
| 考察维度 (固定顺序) | 1.学历 | 2.长相 | 3.人品 | 4.沟通 | 5.发量 | 6.情绪稳定 |
|---|---|---|---|---|---|---|
| 追求者 A 的向量 | ||||||
| 追求者 B 的向量 |
结论来了: 这一串按死顺序排列的数字 [8, 7, 9, 6, 5, 8],在 AI 眼里就是一条“向量”。几项属性,就是几维。这里有 6 个属性,它就是一个 6 维向量。
顺序绝对不能乱!如果把发量(5)和长相(7)填反了,A 就变成了一个秃头大帅哥,这完全是另外一个人了。
二、 为什么万物皆可向量化(Embedding)?
既然 6 个维度可以描述一个相亲对象,那我们把维度拉满呢?
如果我们用 几百万个维度(代表每一个像素点的颜色),我们就能用一条超长的向量表示一张高清照片。 如果我们用 4096 个维度,我们就能极其精准地描述一个人类的“词语”。
这就是“映射”或“Embedding”。大模型(比如 ChatGPT)在听到你说话时,它根本不认识汉字。它做的第一件事,就是去查字典,把你说的每一个词,替换成一条长长的向量(数字 DNA)。
比如:
“苹果”的 DNA 可能是: [水果属性: 0.9, 科技公司属性: 0.8, 红色属性: 0.7, 汽车属性: 0.0 ...]“汽车”的 DNA 可能是: [水果属性: 0.0, 科技公司属性: 0.1, 红色属性: 0.3, 汽车属性: 0.9 ...]
这个思想极其暴力且有效。算了一笔账:宇宙里的原子多到数不清,但即便每一维只填 0 或 1,仅仅 266 维的向量,就能组合出比全宇宙原子数量还要多的变化!所以,用几千维的向量去描述人类几万个汉字,简直是降维打击,绰绰有余。
三、 向量的运算在干嘛?AI 的“灵魂法宝”
把万事万物变成一长串数字后,计算机就可以大显身手了,因为它最擅长做加减乘除。
在 AI 里,向量的加法和点积,有着极其接地气的现实意义:
1. 向量加法 = 融合信息(打补丁 / 加 Buff)
就像玩 RPG 游戏,你的基础属性是 [力量10, 智力5, 敏捷8]。
这时候你穿上了一件“极速披风”,这件装备的属性向量是 [力量0, 智力0, 敏捷5]。
把你和披风的向量对应位置相加:
[10+0, 5+0, 8+5] = [10, 5, 13]现实含义: AI 通过向量加法,把新的知识、新的特征,无缝融合到了原来的事物身上。
2. 向量点积 = 算八字(测匹配度 / 找相似性)
这是 AI 理解人类语言最核心的公式。
怎么算点积?就是把两个事物的向量,“同一个位置相乘,最后把所有乘积加起来”。
我们算算“苹果”和“手机”有多般配:
| 隐藏维度 | 1.科技 | 2.水果 | 3.手机产品 | 4.时间 | 5.新闻 | 6.交通 | 7.食物 |
|---|---|---|---|---|---|---|---|
| “苹果”的向量 | |||||||
| “手机”的向量 | |||||||
| 对应位置相乘 |
最后全部加起来(点积总得分):0.72 + 0 + 0.6 + 0.01 + 0.3 + 0 + 0 = 1.63 分
再算算“手机”和“昨天”的点积得分,按照同样的乘法再相加,算出来只有 0.64 分。
现实含义揭晓:
得分 1.63 > 得分 0.64。所以 AI 得出一个结论:“苹果”和“手机”在语义上是强相关的,而“手机”和“昨天”没啥必然联系。
当你在搜索引擎里输入“如何做红烧肉”时,后台其实就是把你这句话变成一个向量,然后和全网几百亿篇文章的向量疯狂做“点积”。哪篇文章算出来的分数最高(匹配度最高),它就把哪篇文章排在第一页推给你。
总结
单维数字太弱,无法描述立体世界,所以我们用按顺序排列的一组数字(向量)来给万物画肖像。 万物皆可向量化,AI 不懂风花雪月,它只认你这串数字 DNA 里的含金量。 加法是用来融合特征的,点积是用来给匹配度打分的。
AI 之所以显得那么聪明,能跟你聊天、能画图,底层根本没有任何玄学,全都是几十亿个向量在一起疯狂地做着乘法和加法。
夜雨聆风