用 AI 总踩坑?因为你没懂它的底层逻辑-夜雨聆风

用 AI 总踩坑?因为你没懂它的底层逻辑

为什么别人的 AI 用着像一个贴心的全能助手，但自己用 AI 的时候感觉就像是一个人工智障呢？

今天我们就来讲讲 AI 的本质是什么。了解这个底层逻辑，对于大家更好地使用 AI，以及一些想转行做 AI 相关行业的同学，都是非常有必要掌握的知识。

一、 AI 的本质：一个极其复杂的函数

用一句话非常简单地概括：AI 其实就是一个非常复杂的函数。

函数大家应该都了解过。最简单的函数就是一元一次函数，比如 y = ax + b，它的函数图像其实就是一条直线。我们都知道，如果知道这条直线上两个点的坐标，我们就能把 a 和 b 求出来，比如求出 y = 3x + 1。之后如果我们给定一个 x（比如 x = 1），就能得出对应的 y。

如果放在我们这个客观物理世界里，假设你的工资是线性增长的，完全符合这个函数模型。我想预测你第七天的工资是多少，只需要代入进去，3 * 7 + 1，第七天的工资应该就是 22。

AI 的本质和这个原理是一样的，只不过 AI 的函数模型非常复杂，它的模型参数量是上亿、上万亿的规模。

为什么要这么大？因为函数越复杂，它能模拟的事物就越多，能输出的东西也越丰富。

像刚才那种线性的一次函数，它只能模拟符合线性增长的客观模型。

但如果是二次函数 y = ax² + bx + c，是不是就能模拟一些先下降、然后再增长的事物了（比如先降再增的股票）？

如果它进一步变得越来越复杂，不再只局限于二维空间，而是三维、四维甚至更高维度的空间，它就可以输出我们看到的 AI 图像，以及大模型给我们的语音、文字回答等各种内容。

二、图像与文字如何变成 AI 能懂的数据？

我们在给 AI 输入指令的时候，并不是直接输入我们肉眼看到的图像或文字。

AI 会根据一定的规则，把图像或者文字转换成一个非常复杂的矩阵（向量）。

比如输入一张图，AI 不会直接看成“猫”，它会将其转化成 [0.2, 0.8, …] 这样的一个向量；“狗”会转化成另一个向量，“飞机”又会转化成另一个。

在多维空间中，猫和狗的向量因为比较接近，所以到时候就会被判定为同一类，这就是简单的图像识别原理。

我们现在用的大模型参数量高达上万亿，它会把我们的输入变成一个非常复杂的矩阵。

AI 经过一系列参数计算后，会输出一个关联的复杂矩阵 y，然后再根据一定规则，把这个矩阵转化回我们能看懂的文字输出出来。

三、 AI 的训练：堪比黄金的算力与数据

所以，AI 的训练其实就是一个参数拟合的过程。

假设在空间中只有两个点，那拟合出来的函数图像方向可能有好几种。但是如果我们已知的数据点越多（比如知道了三个点），那函数曲线至少必须穿过这几个点，它拟合出来的结果就会更具确定性，也越接近真实值。

这就是为什么在 AI 训练中，算力和数据是堪比黄金的硬通货：

数据：你喂给 AI 的数据量越多、质量越高，解出来的函数曲线就越接近我们想要的效果。

算力：算力越高，当我们输入一个 x 之后，AI 的计算速度就越快，它反映出来的回答质量也就越好。

四、大模型真的在“思考”吗？

有些同学可能会有疑问：我们和大模型聊天时，它们不是在思考吗？因为它们的回答反应看起来很像真人。

其实并不是。AI 只是在我们喂给它的庞大数据库（即拟合好的参数矩阵）里，去计算“下一个词”出现概率最大的是哪一个。

比如你对 AI 说“我想要…”，让它往下接词。它经过计算后，可能的选项有“上学”、“怒放的生命”等。它根据之前学习的数据库发现，顺着语境接“上学”的概率只有 0.2，而接“怒放的生命”的概率高达 0.8，那它最后就会给你输出“怒放的生命”。

AI 本身并不能理解你说话的含义。就像大家做英语完形填空一样，一段话被挖了几个空，我们会根据之前学到的语法、阅读习惯和规则，去选一个最适合填在这个空里的词。

AI 产生文字的过程也是如此，它只是根据训练好的函数计算出相应的 y，然后判断后面最可能出现的词是什么。比如你起个头说“春天”，后面可能会接“春暖花开”或“冰天雪地”，那它肯定判断接“春暖花开”的概率更大。

五、为什么 AI 会产生“幻觉”？

AI 产生幻觉的原因也正是在此。

AI 的核心目标，是“生成符合语境、满足你需求的文本”，而不是“生成百分之百符合客观事实的内容”。既然它是通过概率一个词接一个词地往后算，那算到后面，就可能接到完全不相关的内容，或者生成一些看似很有道理实则虚假的词语来骗你。

六、提示词（Prompt）为什么这么重要？

既然了解了底层原理，你就明白为什么在使用 AI 时，必须要给它一个好的 Prompt（提示词）了。

提示词给得越好、越详细，就相当于你给函数的已知输入项越多。假设 AI 的模型是 y = 2x + 3b：

如果我们只告诉它 x = 1，那么后面 3b 的部分它就要自己去随机生成瞎猜。

但如果我们把变量都给它明确的值，告诉它 x = 1 且 b = 2，那么 y 就会得出一个高度准确的确定值。

总结一下，AI 的本质其实就是一个极其复杂的函数，它和我们最初学到的 y = kx + b 在底层逻辑上并没有任何本质的区别