AI、大模型与算力:概念澄清

前言

Dmmsys Manufacturing Essence AI在迭代的过程中，也有同行发布AI功能模块，群里也有不少交流，我感觉是在AI技术飞速发展的时代，相信有不少人会和我最初一样，傻傻的分不清AI、大模型、本体论等许多不断涌现的术语，那么今天我们就先从AI、大模型与算力开始，进行概念梳理，来一个正本清源。

一、问题的提出

“AI”一词在当前的技术讨论中被广泛使用，但其含义却日益模糊。

厂商宣称产品“内置AI”，专家预测“AI将颠覆一切”，基础设施提供商强调“AI时代必须购买算力”。然而，当问及“AI到底是什么”时，答案往往不一致：

有人说AI是大模型
有人说AI是神经网络
有人说AI是能自动执行任务的程序
有人说“AI就是ChatGPT”

这些理解都不够准确。如果不澄清AI的基本定义，后续关于AI如何应用于ERP系统、企业是否需要自建算力、大模型能做什么不能做什么等问题的讨论，将缺乏共同的基础。

本文旨在从AI的权威定义出发，厘清AI、大模型（LLM）、算力三者之间的关系，为后续讨论建立概念基础。

二、AI的权威定义

人工智能（Artificial Intelligence） 这一术语诞生于1956年的达特茅斯会议。该会议聚集了麦卡锡、明斯基、香农、西蒙等学者，共同探讨“如何让机器模拟人类智能”这一命题。

关于AI的定义，学术界有多种表述。其中被广泛引用的是斯坦福大学Nils Nilsson教授的定义：

“人工智能就是致力于让机器模拟人类智能行为的学科。”

这一定义包含四个关键要素：

要素	含义
致力于	AI是一个目标导向的研究领域，而非一项已完成的特定技术
让机器	研究对象是人工系统，而非生物系统
模拟人类智能行为	目标是复现人类的感知、理解、推理、决策、学习、行动等能力
学科	AI是一个知识领域，而非单一技术或产品

由此可知：AI是一个学科、一个技术领域，而非某一项具体技术。

三、AI作为学科的研究范畴

AI作为一门学科，研究的是“智能行为”的各个维度：

维度	研究内容	技术成熟度
感知	让机器识别图像、理解语音	较成熟
理解	让机器解析自然语言的语义	快速发展中
推理	让机器基于规则和知识进行逻辑推导	早期阶段
决策	让机器在不确定性条件下选择最优行动	较成熟
学习	让机器从数据中提取模式和规律	较成熟
行动	让机器执行数字或物理世界中的操作	较成熟

这六个维度共同构成了AI研究的完整范畴。大语言模型（LLM）主要在上述“理解”维度上取得了突破，并未覆盖AI的全部研究领域。

四、AI领域的主要技术分支

AI作为一个发展数十年的学科，已经产生了多种不同的技术实现路径。这些技术各有适用场景，不存在一种技术完全取代另一种的情况。

技术分支	诞生年代	核心原理	典型应用
规则引擎	1970s	if-then逻辑，专家知识编码	审批流程、合规检查
决策树	1980s	树状决策模型	客户分群、信用评分
遗传算法	1970s	模拟自然选择和进化	排产优化、路径规划
传统机器学习	1990s	从标注数据中学习模式	销量预测、异常检测
深度学习	2010s	多层神经网络	图像识别、语音识别
大语言模型(LLM)	2020s	海量无标注数据预训练	自然语言理解、内容生成

以上所有技术分支均属于AI领域。大语言模型是这一列表中的最新成员，但并非AI的全部。

五、大语言模型（LLM）的精确定位

大语言模型是AI领域中“自然语言理解与生成”这一研究方向上的最新技术成果。

核心原理：

在海量文本数据上进行预训练
学习语言的统计规律和模式
根据上下文预测后续内容，生成连贯文本

能力边界：

擅长的任务	不擅长的任务
理解自然语言意图	精确计算
生成人类可读的内容	确定性规则执行
文本摘要和翻译	保证100%正确性
辅助代码生成	理解真实语义（仅有统计规律）
对话和问答	承担最终责任

结论：LLM解决的是“让机器理解人类语言并生成可读内容”的问题，不解决精确计算、确定性规则执行、业务逻辑处理的问题。

六、算力的真实角色

算力指计算能力，具体表现为CPU、GPU、TPU、算力集群等硬件基础设施。

算力与LLM的关系：LLM的训练和推理需要大量算力，算力是LLM的基础设施。

但需要区分以下两个命题：

命题	正确性	说明
算力是LLM的基础设施	正确	LLM的训练和推理确实需要GPU等算力资源
算力是AI的基础设施	错误	规则引擎、决策树、传统机器学习等AI技术可在普通服务器上运行

当前部分基础设施提供商将“LLM的基础设施”宣传为“AI的基础设施”，这是一种商业推广策略，而非技术上的必然要求。

七、三层框架：AI、LLM、算力的关系

综合以上分析，可将三者关系归纳为以下三层框架：

层级	概念	本质	类比
L1 领域层	AI（人工智能）	一个技术领域	物理学
L2 技术层	LLM（大语言模型）	AI领域中的一项具体技术	量子力学
L3 基础设施层	算力	支撑LLM的底层基础设施	粒子对撞机

基于这一框架，可以得出三条基本结论：

AI ≠ LLM：LLM只是AI领域中的一项技术，而非AI的全部
算力 ≠ AI的基础设施：算力是LLM的基础设施，而非整个AI领域的基础设施
不应将L3等同于L1：购买GPU、训练大模型，不等于实施了AI转型

八、澄清常见误解

基于上述框架，可以识别当前讨论中常见的概念混淆：

常见说法	框架分析	实际情况
“AI时代必须购买算力”	将AI等同于LLM，将L3等同于L1	大量业务问题可用规则引擎和传统机器学习解决，不需要特殊算力
“不使用大模型就不是AI”	将L2等同于L1	规则引擎、传统机器学习等均属于AI，且适用于多数场景
“AI将取代现有系统”	高估了L2的能力边界	LLM擅长交互层，不擅长执行层的精确业务逻辑
“公司完成了AI转型”	表述模糊	需要明确：使用了AI领域中的哪项技术？解决了什么具体问题？

九、对企业技术决策的指导意义

基于上述概念框架，企业在进行技术选型时可以参考以下原则：

业务问题	适用的AI技术	所需基础设施
用户通过自然语言查询数据	LLM（意图理解）	调用API即可，无需自建算力
库存低于阈值时自动补货	规则引擎	普通服务器
预测未来销量	传统机器学习	普通服务器
优化生产排程	遗传算法	普通服务器
判断发票是否合规	规则引擎 + OCR	普通服务器
生成报表摘要	LLM（内容生成）	调用API即可

核心原则：

针对不同的业务问题，从AI技术工具箱中选择最合适的技术
不应因为LLM是当前热点，就将所有问题都交由LLM处理
不应因为LLM需要算力，就认为所有AI应用都必须购买GPU

十、总结

本文的核心观点可以归纳为以下三条：

AI是一个技术领域，而非一项单一技术。其权威定义是“致力于让机器模拟人类智能行为的学科”。
LLM是AI领域中的一项具体技术，擅长自然语言理解与生成，但不擅长精确计算和确定性规则执行。
算力是LLM的基础设施，但不是整个AI领域的基础设施。大量AI技术可以在普通服务器上运行，无需特殊算力。

理解这三层关系，是正确讨论和应用AI技术的前提。

本文基于公开的学术定义和技术资料整理，旨在为自己理清概念之间的关系，也为技术决策提供概念基础。