第1期:AI、机器学习、深度学习、大模型,到底是什么关系?

《工程师 AI 入门课：从机器学习到大模型》系列

系列导读

《工程师 AI 入门课：从机器学习到大模型》，是一门写给材料工程师的 AI 通识课。

很多 AI 培训讲师懂算法，却未必真正做过工程项目，也不了解企业现场的数据混乱、实验成本、工艺约束和落地难题。

这门课不追求把 AI 讲得多高深，而是希望用工程师听得懂的语言，讲清机器学习、深度学习和大模型到底是什么，能解决哪些真实问题，又有哪些边界。

第1期：AI、机器学习、深度学习、大模型，到底是什么关系？

你有没有过这样的感觉：

一会儿有人说 AI，一会儿有人说机器学习，一会儿又冒出深度学习、大模型、ChatGPT。

这些词听起来都很厉害，也都跟“智能”有关。

但问题是，它们到底是不是一回事？

如果你是材料工程师，可能还会进一步困惑：

我做配方优化、性能预测、文献分析、实验设计，到底应该用 AI，还是机器学习？是一定要上大模型吗？ChatGPT 又属于哪一类？

先给一个简单答案：

AI、机器学习、深度学习、大模型，不是并列关系，而是层层包含、逐步发展的关系。

你可以把它们理解成这样：

AI 是最大的概念。机器学习是实现 AI 的一种重要方法。深度学习是机器学习中的一类方法。大模型是深度学习发展到大规模之后的新阶段。

换句话说：

大模型属于深度学习，深度学习属于机器学习，机器学习属于 AI。

这句话先记住。

后面我们慢慢拆开。

1. 它们不是并列关系，而是包含关系

很多人第一次接触 AI 时，会把这些词放在同一个层级上理解：

AI 是一种技术。机器学习也是一种技术。深度学习也是一种技术。大模型也是一种技术。

看起来好像只是四个不同的工具。

但这样理解，很容易乱。

更准确的关系应该是：

AI 是目标，机器学习是路径，深度学习是方法，大模型是阶段。

举个不太严谨但好理解的类比。

如果“交通”是一个大概念，那么汽车、火车、飞机都是交通工具；如果“AI”是一个大概念，那么机器学习、专家系统、搜索算法等都可以是实现 AI 的方式。

而在机器学习里面，又有很多方法。比如线性回归、决策树、随机森林、支持向量机，也包括神经网络。

深度学习，就是神经网络发展到“多层结构”之后的一类方法。

再往后，当深度学习模型变得非常大，参数非常多，训练数据非常丰富，并且能够处理文本、图像、代码、语音等复杂任务时，我们就进入了“大模型”的阶段。

所以它们不是四个孤立概念。

它们像一个套娃：

AI ⊃ 机器学习 ⊃ 深度学习 ⊃ 大模型

这就是整篇文章最重要的框架。

2. AI：让机器表现出智能的总称

先说 AI。

AI，全称 Artificial Intelligence，人工智能。

它的核心目标很简单：

让机器表现出某种“像人一样的智能行为”。

注意，这里说的是“表现出”，不一定是真的像人一样思考。

比如：

机器能够识别图片里的缺陷；能够根据历史数据预测材料强度；能够推荐更可能成功的实验配方；能够理解一篇论文的大意；能够和人进行自然语言对话。

这些都可以被放在 AI 的范畴里。

所以，AI 不是某一种具体算法。

它更像一个大方向，一个总称。

早期的 AI 不一定需要机器学习。

比如一些专家系统，就是把专家经验写成规则：

如果温度高于某个值，并且压力达到某个范围，就判断为某种状态；如果检测到某些特征组合，就给出某种诊断结论。

这种方法也可以叫 AI，因为它确实让机器具备了一部分“判断能力”。

但它的问题也很明显：

规则需要人写。规则越多，系统越复杂。遇到没写过的情况，机器就不会处理。

于是，人们开始想：

能不能不要把所有规则都手工写进去？能不能让机器自己从数据里学规律？

这就进入了机器学习。

3. 机器学习：从数据中学习规律

机器学习，英文叫 Machine Learning。

它解决的是一个非常关键的问题：

不再完全依赖人手写规则，而是让机器从数据中学习规律。

比如，材料工程里有一个常见问题：

已知一批材料的成分、工艺参数、热处理条件，以及最终性能。我们希望预测下一组新配方的性能。

传统方式可能依赖经验公式或工程师判断。

机器学习的思路是：

把历史数据交给模型，让模型自己寻找输入和输出之间的关系。

输入可以是：

成分比例；烧结温度；保温时间；冷却速率；显微组织特征；加工参数。

输出可以是：

硬度；强度；韧性；导电率；腐蚀速率；失效概率。

模型并不知道“材料学原理”本身。

但它可以通过大量样本，学习到某种统计规律。

这就是机器学习最核心的变化：

从“人写规则”，变成“机器从数据中归纳规则”。

当然，机器学习不是魔法。

它很依赖数据质量。

如果数据少、噪声大、记录不完整，模型学到的规律就可能不稳定。如果训练数据和真实使用场景差异很大，模型预测也可能失真。

所以，对工程师来说，机器学习不是替代专业知识。

恰恰相反。

越懂业务，越知道哪些数据该收集，哪些特征有意义，哪些预测结果不能轻信。

4. 深度学习：用多层神经网络处理复杂问题

那深度学习又是什么？

简单说：

深度学习是机器学习的一类方法，它主要使用多层神经网络来学习复杂规律。

这里的“深度”，指的是网络层数比较多。

你可以把神经网络想象成一个复杂的信息处理系统。

第一层可能识别一些简单特征；中间层逐步组合这些特征；更高层形成更抽象的判断。

比如在图像识别里：

低层可能识别边缘、纹理、颜色变化；中层可能识别局部形状；高层可能识别出裂纹、孔洞、晶粒边界、夹杂物等结构。

这就是深度学习擅长的地方：

它特别适合处理复杂、非线性、高维度的数据。

图像、语音、自然语言、复杂传感器数据，都属于这一类。

材料领域也有很多深度学习可以发挥作用的场景：

显微组织图像识别；缺陷检测；谱图分析；晶体结构预测；材料性质预测；分子表示学习；实验数据自动分类。

但深度学习也有代价。

它通常需要更多数据、更强算力、更复杂的训练过程。模型也更难解释。

这就带来一个现实问题：

是不是所有机器学习问题都应该直接上深度学习？

答案是否定的。

如果你的数据只有几百条，特征也比较清晰，也许随机森林、XGBoost、线性模型就已经很好用。如果你处理的是图像、文本、复杂结构数据，深度学习才更有优势。

方法越先进，不代表越适合。适合问题，才是工程上的先进。

5. 大模型：深度学习发展到大规模后的新阶段

接下来是大模型。

大模型不是凭空出现的新物种。

它本质上仍然属于深度学习。

只不过，它把深度学习推到了一个更大的规模：

模型参数更多；训练数据更多；训练算力更强；任务能力更广；可以处理更复杂的输入和输出。

我们今天说的大语言模型，通常是指在海量文本和其他数据上训练出来的模型。它们可以理解问题、生成文本、写代码、总结文档、翻译语言、规划步骤。

为什么大模型让人感觉和过去的 AI 不一样？

因为它从“只能做一个特定任务”，变成了“可以处理很多通用任务”。

过去一个模型可能只会做一件事：

预测某种性能；识别某类缺陷；判断某个图像类别。

而大模型可以同时做很多事：

帮你读论文；解释概念；生成实验方案初稿；整理会议纪要；写 Python 脚本；把材料数据表转成分析思路；辅助构建机器学习流程。

这是一种能力范围的变化。

但要注意：

大模型不是万能模型。它很强，但并不等于所有 AI 问题的最佳答案。

它擅长语言、知识组织、推理辅助、代码生成和多模态理解。但如果你要做高精度的材料性能预测，很多时候仍然需要专门的数据、专门的模型和严格验证。

大模型更像一个强大的“智能接口”和“工作流中枢”。

它可以帮你连接知识、工具、数据和人。

但真正的工程判断，仍然需要专业体系来兜底。

6. ChatGPT 到底属于哪一层？

那 ChatGPT 属于哪一层？

答案是：

ChatGPT 是 AI 应用，底层基于大语言模型；大语言模型属于大模型，大模型属于深度学习，深度学习属于机器学习，机器学习属于 AI。

听起来有点绕。

我们换一种说法。

如果从用户看到的产品来看，ChatGPT 是一个 AI 助手。如果从技术底层来看，它背后是大语言模型。如果从方法分类来看，大语言模型属于深度学习。如果再往上看，深度学习属于机器学习。最终，所有这些都属于 AI。

所以，ChatGPT 不是和 AI、机器学习、深度学习并列的概念。

它是这个技术体系发展到今天之后，一个非常有代表性的应用形态。

这就像你不能说“手机”和“通信技术”是并列关系。

手机是通信技术发展出来的产品之一。ChatGPT 也是 AI 技术发展出来的产品之一。

分清层级，很多概念就不会打架。

7. 材料工程师为什么要分清这些概念？

有人可能会问：

这些概念听起来很理论。我做材料研发，真的有必要分这么清楚吗？

有必要。

因为你分不清概念，就很容易选错工具。

比如你想做一个材料性能预测模型。

如果你的数据是结构化表格，样本量不大，特征也比较明确，那么传统机器学习方法可能就够了。

你不一定需要大模型。

再比如你想从上千篇论文中提取材料体系、制备方法、性能数据和实验条件。

这时候，大语言模型就很有价值。

因为它擅长处理文本、总结信息、抽取结构化内容。

再比如你想识别显微组织图像中的缺陷、晶粒形貌或相分布。

这时候，深度学习中的计算机视觉模型可能更合适。

不同问题，对应不同工具。

分清概念的真正意义，不是为了背定义，而是为了做判断。

材料研发里最怕的不是不用 AI。

而是把所有问题都丢给同一种 AI。

性能预测、图像识别、文献总结、实验设计、工艺优化，看起来都叫“AI 应用”，但底层方法可能完全不同。

工程师要做的，不是追一个最热的词。

而是问清楚：

我的问题是什么？我的数据是什么？我需要什么输出？误差能接受到什么程度？结果是否需要解释？是否需要和实验闭环验证？

这些问题，比“要不要用大模型”更重要。

8. 不是所有问题都需要大模型

现在大模型很热。

热到很多人一提 AI，就默认是在说大模型。

但这其实是一个误区。

大模型是 AI 的重要进展，但不是 AI 的全部。

对于材料工程师来说，很多实际问题并不需要大模型。

比如：

用历史实验数据预测某个力学性能；用工艺参数优化成品率；分析某几个变量对性能的影响；建立一个小型的质量预警模型。

这些任务，传统机器学习可能更轻、更快、更稳定，也更容易解释。

大模型当然可以参与。

比如帮你写代码、解释结果、生成报告、整理实验方案。

但最终用于预测的核心模型，不一定是大模型。

这就像做实验。

不是所有问题都需要最贵的设备。有些问题，用合适的常规仪器反而更高效。

AI 也是一样。

不要用技术热度决定方案，要用问题特征决定方案。

这句话对工程实践非常重要。

因为企业或实验室真正关心的不是“有没有用大模型”，而是：

能不能降低试错成本；能不能提高研发效率；能不能减少重复劳动；能不能让实验设计更有依据；能不能让结果更可靠。

如果一个简单模型已经能解决问题，就不要为了“先进”而复杂化。如果问题确实需要大模型，也不要因为它新就拒绝它。

关键是匹配。

9. 未来材料研发需要的是“组合式 AI 工作流”

那未来材料研发到底会怎么使用 AI？

我认为，不是单一模型包打天下。

更可能是：

大模型 + 专用机器学习模型 + 专业数据库 + 实验自动化 + 工程师判断，形成组合式 AI 工作流。

举个例子。

你想开发一种新材料。

第一步，大模型可以帮你快速阅读文献，梳理已有材料体系、性能指标和研究路线。

第二步，材料数据库和知识图谱可以提供已有成分、结构、工艺和性能数据。

第三步，机器学习模型可以基于历史数据预测候选配方的性能。

第四步，优化算法可以推荐下一批最值得做的实验。

第五步，实验平台完成制备与测试。

第六步，新的实验数据再回流到模型中，继续迭代。

在这个流程里，大模型很重要。

但它不是唯一主角。

它更像一个协调者、解释器和知识接口。而专用模型负责预测，实验系统负责验证，工程师负责判断方向和边界。

这才是更现实的未来。

未来的材料 AI，不是一个模型替代所有人，而是一套工作流放大工程师的能力。

这也是材料工程师学习 AI 的真正价值。

不是为了变成算法工程师。而是为了知道什么时候该用什么工具，怎样把工具接进自己的研发流程。

总结：先把关系理顺，再谈怎么使用

回到开头的问题：

AI、机器学习、深度学习、大模型，到底是什么关系？

现在可以用一句话回答：

AI 是总目标，机器学习是重要路径，深度学习是机器学习中的关键方法，大模型是深度学习规模化后的新阶段。

ChatGPT 则是大模型时代非常典型的 AI 应用。

对材料工程师来说，理解这层关系，不是概念洁癖。

它决定了你在真实研发中，能不能选对工具、设计好流程、判断结果是否可信。

当你面对一个材料问题时，不妨先别急着问：

“能不能用大模型？”

而是先问：

“这是一个预测问题、识别问题、生成问题，还是决策问题？”“我的数据是什么形态？”“我需要的是准确率、解释性、效率，还是知识整理能力？”

问题问清楚，工具自然会清楚。

AI 的入门，不是从追热点开始，而是从分清问题开始。

如果文章对你有启发，欢迎转发、点赞、关注。

一起把材料研发，从经验试错，升级为数据驱动。