《工程师 AI 入门课:从机器学习到大模型》系列
系列导读
《工程师 AI 入门课:从机器学习到大模型》,是一门写给材料工程师的 AI 通识课。
很多 AI 培训讲师懂算法,却未必真正做过工程项目,也不了解企业现场的数据混乱、实验成本、工艺约束和落地难题。
这门课不追求把 AI 讲得多高深,而是希望用工程师听得懂的语言,讲清机器学习、深度学习和大模型到底是什么,能解决哪些真实问题,又有哪些边界。
第1期:AI、机器学习、深度学习、大模型,到底是什么关系?

你有没有过这样的感觉:
一会儿有人说 AI,一会儿有人说机器学习,一会儿又冒出深度学习、大模型、ChatGPT。
这些词听起来都很厉害,也都跟“智能”有关。
但问题是,它们到底是不是一回事?
如果你是材料工程师,可能还会进一步困惑:
我做配方优化、性能预测、文献分析、实验设计,到底应该用 AI,还是机器学习?是一定要上大模型吗?ChatGPT 又属于哪一类?
先给一个简单答案:
AI、机器学习、深度学习、大模型,不是并列关系,而是层层包含、逐步发展的关系。
你可以把它们理解成这样:
AI 是最大的概念。机器学习是实现 AI 的一种重要方法。深度学习是机器学习中的一类方法。大模型是深度学习发展到大规模之后的新阶段。
换句话说:
大模型属于深度学习,深度学习属于机器学习,机器学习属于 AI。
这句话先记住。
后面我们慢慢拆开。
1. 它们不是并列关系,而是包含关系
很多人第一次接触 AI 时,会把这些词放在同一个层级上理解:
AI 是一种技术。机器学习也是一种技术。深度学习也是一种技术。大模型也是一种技术。
看起来好像只是四个不同的工具。
但这样理解,很容易乱。
更准确的关系应该是:
AI 是目标,机器学习是路径,深度学习是方法,大模型是阶段。
举个不太严谨但好理解的类比。
如果“交通”是一个大概念,那么汽车、火车、飞机都是交通工具;如果“AI”是一个大概念,那么机器学习、专家系统、搜索算法等都可以是实现 AI 的方式。
而在机器学习里面,又有很多方法。比如线性回归、决策树、随机森林、支持向量机,也包括神经网络。
深度学习,就是神经网络发展到“多层结构”之后的一类方法。
再往后,当深度学习模型变得非常大,参数非常多,训练数据非常丰富,并且能够处理文本、图像、代码、语音等复杂任务时,我们就进入了“大模型”的阶段。
所以它们不是四个孤立概念。
它们像一个套娃:
AI ⊃ 机器学习 ⊃ 深度学习 ⊃ 大模型
这就是整篇文章最重要的框架。

2. AI:让机器表现出智能的总称
先说 AI。
AI,全称 Artificial Intelligence,人工智能。
它的核心目标很简单:
让机器表现出某种“像人一样的智能行为”。
注意,这里说的是“表现出”,不一定是真的像人一样思考。
比如:
机器能够识别图片里的缺陷;能够根据历史数据预测材料强度;能够推荐更可能成功的实验配方;能够理解一篇论文的大意;能够和人进行自然语言对话。
这些都可以被放在 AI 的范畴里。
所以,AI 不是某一种具体算法。
它更像一个大方向,一个总称。
早期的 AI 不一定需要机器学习。
比如一些专家系统,就是把专家经验写成规则:
如果温度高于某个值,并且压力达到某个范围,就判断为某种状态;如果检测到某些特征组合,就给出某种诊断结论。
这种方法也可以叫 AI,因为它确实让机器具备了一部分“判断能力”。
但它的问题也很明显:
规则需要人写。规则越多,系统越复杂。遇到没写过的情况,机器就不会处理。
于是,人们开始想:
能不能不要把所有规则都手工写进去?能不能让机器自己从数据里学规律?
这就进入了机器学习。
3. 机器学习:从数据中学习规律
机器学习,英文叫 Machine Learning。
它解决的是一个非常关键的问题:
不再完全依赖人手写规则,而是让机器从数据中学习规律。
比如,材料工程里有一个常见问题:
已知一批材料的成分、工艺参数、热处理条件,以及最终性能。我们希望预测下一组新配方的性能。
传统方式可能依赖经验公式或工程师判断。
机器学习的思路是:
把历史数据交给模型,让模型自己寻找输入和输出之间的关系。
输入可以是:
成分比例;烧结温度;保温时间;冷却速率;显微组织特征;加工参数。
输出可以是:
硬度;强度;韧性;导电率;腐蚀速率;失效概率。
模型并不知道“材料学原理”本身。
但它可以通过大量样本,学习到某种统计规律。
这就是机器学习最核心的变化:
从“人写规则”,变成“机器从数据中归纳规则”。
当然,机器学习不是魔法。
它很依赖数据质量。
如果数据少、噪声大、记录不完整,模型学到的规律就可能不稳定。如果训练数据和真实使用场景差异很大,模型预测也可能失真。
所以,对工程师来说,机器学习不是替代专业知识。
恰恰相反。
越懂业务,越知道哪些数据该收集,哪些特征有意义,哪些预测结果不能轻信。
4. 深度学习:用多层神经网络处理复杂问题
那深度学习又是什么?
简单说:
深度学习是机器学习的一类方法,它主要使用多层神经网络来学习复杂规律。
这里的“深度”,指的是网络层数比较多。
你可以把神经网络想象成一个复杂的信息处理系统。
第一层可能识别一些简单特征;中间层逐步组合这些特征;更高层形成更抽象的判断。
比如在图像识别里:
低层可能识别边缘、纹理、颜色变化;中层可能识别局部形状;高层可能识别出裂纹、孔洞、晶粒边界、夹杂物等结构。
这就是深度学习擅长的地方:
它特别适合处理复杂、非线性、高维度的数据。
图像、语音、自然语言、复杂传感器数据,都属于这一类。
材料领域也有很多深度学习可以发挥作用的场景:
显微组织图像识别;缺陷检测;谱图分析;晶体结构预测;材料性质预测;分子表示学习;实验数据自动分类。
但深度学习也有代价。
它通常需要更多数据、更强算力、更复杂的训练过程。模型也更难解释。
这就带来一个现实问题:
是不是所有机器学习问题都应该直接上深度学习?
答案是否定的。
如果你的数据只有几百条,特征也比较清晰,也许随机森林、XGBoost、线性模型就已经很好用。如果你处理的是图像、文本、复杂结构数据,深度学习才更有优势。
方法越先进,不代表越适合。适合问题,才是工程上的先进。
5. 大模型:深度学习发展到大规模后的新阶段
接下来是大模型。
大模型不是凭空出现的新物种。
它本质上仍然属于深度学习。
只不过,它把深度学习推到了一个更大的规模:
模型参数更多;训练数据更多;训练算力更强;任务能力更广;可以处理更复杂的输入和输出。
我们今天说的大语言模型,通常是指在海量文本和其他数据上训练出来的模型。它们可以理解问题、生成文本、写代码、总结文档、翻译语言、规划步骤。
为什么大模型让人感觉和过去的 AI 不一样?
因为它从“只能做一个特定任务”,变成了“可以处理很多通用任务”。
过去一个模型可能只会做一件事:
预测某种性能;识别某类缺陷;判断某个图像类别。
而大模型可以同时做很多事:
帮你读论文;解释概念;生成实验方案初稿;整理会议纪要;写 Python 脚本;把材料数据表转成分析思路;辅助构建机器学习流程。
这是一种能力范围的变化。
但要注意:
大模型不是万能模型。它很强,但并不等于所有 AI 问题的最佳答案。
它擅长语言、知识组织、推理辅助、代码生成和多模态理解。但如果你要做高精度的材料性能预测,很多时候仍然需要专门的数据、专门的模型和严格验证。
大模型更像一个强大的“智能接口”和“工作流中枢”。
它可以帮你连接知识、工具、数据和人。
但真正的工程判断,仍然需要专业体系来兜底。
6. ChatGPT 到底属于哪一层?
那 ChatGPT 属于哪一层?
答案是:
ChatGPT 是 AI 应用,底层基于大语言模型;大语言模型属于大模型,大模型属于深度学习,深度学习属于机器学习,机器学习属于 AI。
听起来有点绕。
我们换一种说法。
如果从用户看到的产品来看,ChatGPT 是一个 AI 助手。如果从技术底层来看,它背后是大语言模型。如果从方法分类来看,大语言模型属于深度学习。如果再往上看,深度学习属于机器学习。最终,所有这些都属于 AI。
所以,ChatGPT 不是和 AI、机器学习、深度学习并列的概念。
它是这个技术体系发展到今天之后,一个非常有代表性的应用形态。
这就像你不能说“手机”和“通信技术”是并列关系。
手机是通信技术发展出来的产品之一。ChatGPT 也是 AI 技术发展出来的产品之一。
分清层级,很多概念就不会打架。
7. 材料工程师为什么要分清这些概念?
有人可能会问:
这些概念听起来很理论。我做材料研发,真的有必要分这么清楚吗?
有必要。
因为你分不清概念,就很容易选错工具。
比如你想做一个材料性能预测模型。
如果你的数据是结构化表格,样本量不大,特征也比较明确,那么传统机器学习方法可能就够了。
你不一定需要大模型。
再比如你想从上千篇论文中提取材料体系、制备方法、性能数据和实验条件。
这时候,大语言模型就很有价值。
因为它擅长处理文本、总结信息、抽取结构化内容。
再比如你想识别显微组织图像中的缺陷、晶粒形貌或相分布。
这时候,深度学习中的计算机视觉模型可能更合适。
不同问题,对应不同工具。
分清概念的真正意义,不是为了背定义,而是为了做判断。
材料研发里最怕的不是不用 AI。
而是把所有问题都丢给同一种 AI。
性能预测、图像识别、文献总结、实验设计、工艺优化,看起来都叫“AI 应用”,但底层方法可能完全不同。
工程师要做的,不是追一个最热的词。
而是问清楚:
我的问题是什么?我的数据是什么?我需要什么输出?误差能接受到什么程度?结果是否需要解释?是否需要和实验闭环验证?
这些问题,比“要不要用大模型”更重要。
8. 不是所有问题都需要大模型
现在大模型很热。
热到很多人一提 AI,就默认是在说大模型。
但这其实是一个误区。
大模型是 AI 的重要进展,但不是 AI 的全部。
对于材料工程师来说,很多实际问题并不需要大模型。
比如:
用历史实验数据预测某个力学性能;用工艺参数优化成品率;分析某几个变量对性能的影响;建立一个小型的质量预警模型。
这些任务,传统机器学习可能更轻、更快、更稳定,也更容易解释。
大模型当然可以参与。
比如帮你写代码、解释结果、生成报告、整理实验方案。
但最终用于预测的核心模型,不一定是大模型。
这就像做实验。
不是所有问题都需要最贵的设备。有些问题,用合适的常规仪器反而更高效。
AI 也是一样。
不要用技术热度决定方案,要用问题特征决定方案。
这句话对工程实践非常重要。
因为企业或实验室真正关心的不是“有没有用大模型”,而是:
能不能降低试错成本;能不能提高研发效率;能不能减少重复劳动;能不能让实验设计更有依据;能不能让结果更可靠。
如果一个简单模型已经能解决问题,就不要为了“先进”而复杂化。如果问题确实需要大模型,也不要因为它新就拒绝它。
关键是匹配。
9. 未来材料研发需要的是“组合式 AI 工作流”
那未来材料研发到底会怎么使用 AI?
我认为,不是单一模型包打天下。
更可能是:
大模型 + 专用机器学习模型 + 专业数据库 + 实验自动化 + 工程师判断,形成组合式 AI 工作流。
举个例子。
你想开发一种新材料。
第一步,大模型可以帮你快速阅读文献,梳理已有材料体系、性能指标和研究路线。
第二步,材料数据库和知识图谱可以提供已有成分、结构、工艺和性能数据。
第三步,机器学习模型可以基于历史数据预测候选配方的性能。
第四步,优化算法可以推荐下一批最值得做的实验。
第五步,实验平台完成制备与测试。
第六步,新的实验数据再回流到模型中,继续迭代。
在这个流程里,大模型很重要。
但它不是唯一主角。
它更像一个协调者、解释器和知识接口。而专用模型负责预测,实验系统负责验证,工程师负责判断方向和边界。
这才是更现实的未来。
未来的材料 AI,不是一个模型替代所有人,而是一套工作流放大工程师的能力。
这也是材料工程师学习 AI 的真正价值。
不是为了变成算法工程师。而是为了知道什么时候该用什么工具,怎样把工具接进自己的研发流程。
总结:先把关系理顺,再谈怎么使用
回到开头的问题:
AI、机器学习、深度学习、大模型,到底是什么关系?
现在可以用一句话回答:
AI 是总目标,机器学习是重要路径,深度学习是机器学习中的关键方法,大模型是深度学习规模化后的新阶段。
ChatGPT 则是大模型时代非常典型的 AI 应用。
对材料工程师来说,理解这层关系,不是概念洁癖。
它决定了你在真实研发中,能不能选对工具、设计好流程、判断结果是否可信。
当你面对一个材料问题时,不妨先别急着问:
“能不能用大模型?”
而是先问:
“这是一个预测问题、识别问题、生成问题,还是决策问题?”“我的数据是什么形态?”“我需要的是准确率、解释性、效率,还是知识整理能力?”
问题问清楚,工具自然会清楚。
AI 的入门,不是从追热点开始,而是从分清问题开始。
如果文章对你有启发,欢迎转发、点赞、关注。
一起把材料研发,从经验试错,升级为数据驱动。

推荐阅读
1. 为什么很多材料 AI 项目,最后都变成了一页 PPT?
夜雨聆风