
在上一讲中,我们纠正了大多数人的认知误区:AI没有意识,不会自主思考,所有智能都是“模拟出来的”。
很多人看完会产生一个新疑问:
既然AI没有脑子,那它到底是怎么学会写字、画画、做题、分析数据的?
为什么刚开始的AI很笨,经过大量训练后,就能越来越聪明、越来越精准?
这就涉及到所有人工智能的核心底层地基——机器学习逻辑。
可以这么说:看懂了机器学习,你就看懂了90%AI工具的运行原理。
今天第二讲,我们全程不聊公式、不堆专业术语,用生活化案例,彻底讲透AI的学习逻辑。
01 人类学习 VS 机器学习:根本不是一回事
想要理解AI学习,首先要区分人的学习和机器的学习,二者的逻辑完全不同。
人类的学习:靠理解、靠悟性、靠举一反三
我们上学、读书、学技能,核心是理解本质。
比如你学会了“什么是苹果”,不需要见过全世界所有苹果,只要看到红色、圆形、带果柄的水果,就能快速判断,还能记住它的味道、用途。
人类学习的特点:懂原理、可迁移、能创新、样本少也能学会。
机器的学习:靠数据、靠规律、靠概率推演
AI完全没有“理解能力”。
它学不会“苹果的概念”,只能学懂“苹果的数据特征”。
简单来说:AI会看成千上万张苹果图片,记录颜色、形状、纹理等所有数据规律,当新图片输入时,它就对比规律,概率性判断这是苹果的可能性。
AI学习的特点:不理解原理、只会找规律、依赖海量数据、不会举一反三。
一句话总结核心差异:
人类靠智慧总结规律,AI靠数据拟合规律。
02 机器学习的三大核心要素:数据、模型、算法
所有AI的学习,无论大模型、AI绘画、语音识别,全部离不开三个核心要素,这是AI的底层铁三角。
1. 数据:AI的学习素材
相当于人类的书本、题库、经验。
没有数据,AI就是一块废铁。数据的质量、数量,直接决定AI聪明程度。
2. 模型:AI的大脑框架
相当于人类的大脑结构。
模型是承载数据规律的容器,我们常听到的“大模型、小模型”,本质就是大脑框架的复杂程度不同。
3. 算法:AI的学习方法
相当于人类的学习思路、解题技巧。
算法负责告诉模型:怎么读取数据、怎么分析规律、怎么修正错误、怎么输出结果。
通俗闭环理解:
AI拿着算法(方法),在模型(大脑)里反复学习数据(素材),不断纠错,最终沉淀出可复用的规律,实现智能输出。
03 秒懂三大核心术语:训练、迭代、拟合
这三个词是AI领域的高频基础词,听懂这三个词,就吃透了AI的完整学习过程。
1. 训练:AI的刷题过程
训练就是AI的“集中学习期”。
开发者把海量数据输入模型,让AI逐条读取、逐条分析,初步建立数据关联。
就像学生考前疯狂刷题,先把所有题目过一遍,建立基础认知。
2. 迭代:AI的纠错升级过程
没有AI一次训练就能完美,初期的AI错误百出。
迭代就是发现错误、修正参数、优化逻辑、重新学习的过程。
每一次迭代,AI的准确率就提升一点,逻辑就通顺一点。
这也是为什么AI会持续更新升级,本质就是不断迭代优化。
3. 拟合:AI最终学会的结果
拟合是AI学习的最终目的,通俗讲就是:AI精准摸透了数据的规律。
拟合得好,AI输出的结果就准、贴合场景;
拟合得差,AI就会出错、跑偏、输出幻觉内容。
这里顺带科普两个新手必懂的坑:
✅ 欠拟合:学太浅,规律没摸透,整体都不准(AI太笨)
✅ 过拟合:学太死,死记硬背数据,不会灵活适配新场景(AI死板)
04 机器学习的三种核心模式:全覆盖通俗解读
所有AI学习方式,归根结底只有三种:监督学习、无监督学习、强化学习。
三种模式覆盖了当下100%的AI应用场景,我们用通俗案例一次性讲透。
1. 监督学习:有答案的刷题(最常用)
核心逻辑:数据带标准答案,AI对照答案学习。
就像学生做带解析的题库,题目和答案一一对应,AI做完就对照纠错,越学越准。
常见场景:AI分类、人脸识别、语音转文字、文案生成、内容审核。
我们日常用到的大模型、AI写作,基本都是基于监督学习优化而来。
2. 无监督学习:无答案的自主归纳
核心逻辑:没有标准答案,AI自己从杂乱数据中找规律、做分类。
相当于给你一堆杂乱无章的物品,没有任何提示,让你自己按照大小、颜色、类型分组。
常见场景:用户人群聚类、异常数据检测、推荐系统初步筛选、大数据分层。
3. 强化学习:试错式自主进化
核心逻辑:通过不断试错,获取奖励,优化行为。
像训练宠物一样:做对了给奖励,做错了受惩罚,反复博弈后,AI学会最优决策。
常见场景:AI下棋、自动驾驶、机器人控制、大模型对齐优化。
05 终极通透:AI的所有智能,都是“概率推演”
看完上面的逻辑,我们可以总结出一个贯穿所有AI的终极底层原理:
AI从来不会“思考”,只会“概率预测”。
当你让AI写文案、回答问题、生成图片时,它不是在构思、不是在创作。
它是根据海量数据学习到的规律,计算出下一个字、下一个像素、下一段内容出现的最大概率,然后依次拼接,形成完整结果。
这就能完美解释所有AI问题:
为什么AI偶尔会胡说八道?——概率推演出错,规律匹配偏差
为什么AI知识有滞后性?——训练数据截止,没有新数据规律
为什么指令越精准,结果越好?——帮助AI锁定更精准的概率范围
本讲核心小结:
1、人机学习本质不同:人类靠理解悟规律,AI靠数据拟合规律,无自主认知;
2、机器学习铁三角:数据(素材)、模型(大脑)、算法(方法),三者缺一不可;
3、核心流程:训练是刷题、迭代是纠错、拟合是学成,欠拟合太笨、过拟合太死板;
4、三大学习模式:监督学习(有答案)、无监督学习(自归纳)、强化学习(试错进化);
5、AI终极逻辑:所有智能输出,都是基于海量数据的概率推演结果。
链接:什么是词元?
词元(Token)是大型语言模型(LLM)用来理解和生成内容的基本数据单位。可以把它想象成AI语境中的“字词”,就如同汉语中的文字或英语中的单词一般。

本篇将从词元的定义、分类、作用和使用建议几个方面介绍。
定义
词元(Token)是AI大模型在训练和推理过程中处理的数据基本单位。它代表文本、音频、图像或其他模态的最小组成部分,使大模型能够有效理解、预测并生成内容。
可以把词元想象成AI词境中的“字词”,但它不能和汉语中文字或英语中的单词划等号。比如,“人工智能”在汉语中是4个字,但在AI领域是高频术语可能仅占1个词元。再比如,“Hello, world!”这样简单的英语句子,可以被拆分成“Hello”、“,”、“world”、“!”这样的4个词元。
所以,词元可以是单个字符(如标点符号)、一个音节、一个完整词,甚至是常用短语。
分类
词元包括输入词元和输出词元,一次会话通常既有输入词数元又有输出词元。
输入词元:主要来自你的提题或对话上下文。提问内容越长,消耗词元越多。
输出词元:大模型的输出是一个个词元输出的,直到完成回答。一样,回答的内容越多,消耗词元越多。
作用
词元会被AI大模型用于训练和推理。当你与像DeepSeek这样的人工智能互动时,你的自然语言描述会被拆分成词元,大模型会进行处理,然后不断预测下一个词元并生成内容。
还可以用来计算费用。一次会话消耗的词元数量是输入词数元和输出词元数的总和,那么通过计算消耗的词元总量就可以计算费用。
大模型并非免费,因为它们需要大量计算资源和成本,如服务器、电力和维护成本。通常会根据实际使用量来计算费用,不同大模型有不同定价标准。
比如,DeepSeek V4-Flash输入价格为1元/百万tokens、输出价格为2元/百万tokens,DeepSeek V4-Pro输入价格为12元/百万tokens、输出价格为24元/百万tokens。GPT-5.5(标准版)输入价格为$ 5 / 百万 tokens、输出价格为$30 / 百万 tokens,GPT-5.5 Pro(高性能版)输入价格为$30 / 百万 tokens、输出价格为$180 / 百万 tokens。
大模型 | 输入价格 | 输出价格 |
DeepSeek V4-Flash(快速版) | 1元/百万tokens | 2元/百万tokens |
DeepSeek V4-Pro(专业版) | 12元/百万tokens | 24元/百万tokens |
GPT-5.5(标准版) | 5美元 / 百万 tokens | 30美元 / 百万 tokens |
GPT-5.5 Pro(高性能版) | 30美元 / 百万 tokens | 180美元 / 百万 tokens |
使用建议
可以根据任务的复杂程度选择不同的大模型来降低成本。尽量精减和优化我们的提示词使输出更加精准间接降低费用。对于开发者来说,可以使用tokenizer等工具来提前估算可能消耗的词元数量,调整任务策略和评估预算。
未来,随着技术发展和时间推移百万词元的价格将越来越便宜。
下一节预告
第三讲我们深度拆解AI的核心燃料——数据!为什么没有数据就没有AI?训练集、验证集、测试集有什么区别?AI幻觉、偏见的根源全在数据,零基础必懂!
持续关注,系统吃透AI底层基础!
夜雨聆风