用 AI 总踩坑?因为你没懂它的底层逻辑
为什么别人的 AI 用着像一个贴心的全能助手,但自己用 AI 的时候感觉就像是一个人工智障呢?
今天我们就来讲讲 AI 的本质是什么。了解这个底层逻辑,对于大家更好地使用 AI,以及一些想转行做 AI 相关行业的同学,都是非常有必要掌握的知识。

一、 AI 的本质:一个极其复杂的函数
用一句话非常简单地概括:AI 其实就是一个非常复杂的函数。
函数大家应该都了解过。最简单的函数就是一元一次函数,比如 y = ax + b,它的函数图像其实就是一条直线。我们都知道,如果知道这条直线上两个点的坐标,我们就能把 a 和 b 求出来,比如求出 y = 3x + 1。之后如果我们给定一个 x(比如 x = 1),就能得出对应的 y。
如果放在我们这个客观物理世界里,假设你的工资是线性增长的,完全符合这个函数模型。我想预测你第七天的工资是多少,只需要代入进去,3 * 7 + 1,第七天的工资应该就是 22。
AI 的本质和这个原理是一样的,只不过 AI 的函数模型非常复杂,它的模型参数量是上亿、上万亿的规模。
为什么要这么大?因为函数越复杂,它能模拟的事物就越多,能输出的东西也越丰富。
像刚才那种线性的一次函数,它只能模拟符合线性增长的客观模型。
但如果是二次函数 y = ax² + bx + c,是不是就能模拟一些先下降、然后再增长的事物了(比如先降再增的股票)?
如果它进一步变得越来越复杂,不再只局限于二维空间,而是三维、四维甚至更高维度的空间,它就可以输出我们看到的 AI 图像,以及大模型给我们的语音、文字回答等各种内容。
二、 图像与文字如何变成 AI 能懂的数据?
我们在给 AI 输入指令的时候,并不是直接输入我们肉眼看到的图像或文字。
AI 会根据一定的规则,把图像或者文字转换成一个非常复杂的矩阵(向量)。
比如输入一张图,AI 不会直接看成“猫”,它会将其转化成 [0.2, 0.8, …] 这样的一个向量;“狗”会转化成另一个向量,“飞机”又会转化成另一个。
在多维空间中,猫和狗的向量因为比较接近,所以到时候就会被判定为同一类,这就是简单的图像识别原理。
我们现在用的大模型参数量高达上万亿,它会把我们的输入变成一个非常复杂的矩阵。
AI 经过一系列参数计算后,会输出一个关联的复杂矩阵 y,然后再根据一定规则,把这个矩阵转化回我们能看懂的文字输出出来。
三、 AI 的训练:堪比黄金的算力与数据
所以,AI 的训练其实就是一个参数拟合的过程。
假设在空间中只有两个点,那拟合出来的函数图像方向可能有好几种。但是如果我们已知的数据点越多(比如知道了三个点),那函数曲线至少必须穿过这几个点,它拟合出来的结果就会更具确定性,也越接近真实值。
这就是为什么在 AI 训练中,算力和数据是堪比黄金的硬通货:
数据: 你喂给 AI 的数据量越多、质量越高,解出来的函数曲线就越接近我们想要的效果。
算力: 算力越高,当我们输入一个 x 之后,AI 的计算速度就越快,它反映出来的回答质量也就越好。
四、 大模型真的在“思考”吗?
有些同学可能会有疑问:我们和大模型聊天时,它们不是在思考吗?因为它们的回答反应看起来很像真人。
其实并不是。AI 只是在我们喂给它的庞大数据库(即拟合好的参数矩阵)里,去计算“下一个词”出现概率最大的是哪一个。
比如你对 AI 说“我想要…”,让它往下接词。它经过计算后,可能的选项有“上学”、“怒放的生命”等。它根据之前学习的数据库发现,顺着语境接“上学”的概率只有 0.2,而接“怒放的生命”的概率高达 0.8,那它最后就会给你输出“怒放的生命”。
AI 本身并不能理解你说话的含义。 就像大家做英语完形填空一样,一段话被挖了几个空,我们会根据之前学到的语法、阅读习惯和规则,去选一个最适合填在这个空里的词。
AI 产生文字的过程也是如此,它只是根据训练好的函数计算出相应的 y,然后判断后面最可能出现的词是什么。比如你起个头说“春天”,后面可能会接“春暖花开”或“冰天雪地”,那它肯定判断接“春暖花开”的概率更大。
五、 为什么 AI 会产生“幻觉”?
AI 产生幻觉的原因也正是在此。
AI 的核心目标,是“生成符合语境、满足你需求的文本”,而不是“生成百分之百符合客观事实的内容”。既然它是通过概率一个词接一个词地往后算,那算到后面,就可能接到完全不相关的内容,或者生成一些看似很有道理实则虚假的词语来骗你。
六、 提示词(Prompt)为什么这么重要?
既然了解了底层原理,你就明白为什么在使用 AI 时,必须要给它一个好的 Prompt(提示词)了。
提示词给得越好、越详细,就相当于你给函数的已知输入项越多。假设 AI 的模型是 y = 2x + 3b:
如果我们只告诉它 x = 1,那么后面 3b 的部分它就要自己去随机生成瞎猜。
但如果我们把变量都给它明确的值,告诉它 x = 1 且 b = 2,那么 y 就会得出一个高度准确的确定值。
总结一下,AI 的本质其实就是一个极其复杂的函数,它和我们最初学到的 y = kx + b 在底层逻辑上并没有任何本质的区别

夜雨聆风