一、问题的提出
“AI”一词在当前的技术讨论中被广泛使用,但其含义却日益模糊。
厂商宣称产品“内置AI”,专家预测“AI将颠覆一切”,基础设施提供商强调“AI时代必须购买算力”。然而,当问及“AI到底是什么”时,答案往往不一致:
有人说AI是大模型
有人说AI是神经网络
有人说AI是能自动执行任务的程序
有人说“AI就是ChatGPT”
这些理解都不够准确。如果不澄清AI的基本定义,后续关于AI如何应用于ERP系统、企业是否需要自建算力、大模型能做什么不能做什么等问题的讨论,将缺乏共同的基础。
本文旨在从AI的权威定义出发,厘清AI、大模型(LLM)、算力三者之间的关系,为后续讨论建立概念基础。
二、AI的权威定义
人工智能(Artificial Intelligence) 这一术语诞生于1956年的达特茅斯会议。该会议聚集了麦卡锡、明斯基、香农、西蒙等学者,共同探讨“如何让机器模拟人类智能”这一命题。
关于AI的定义,学术界有多种表述。其中被广泛引用的是斯坦福大学Nils Nilsson教授的定义:
“人工智能就是致力于让机器模拟人类智能行为的学科。”
这一定义包含四个关键要素:
| 要素 | 含义 |
|---|---|
| 致力于 | AI是一个目标导向的研究领域,而非一项已完成的特定技术 |
| 让机器 | 研究对象是人工系统,而非生物系统 |
| 模拟人类智能行为 | 目标是复现人类的感知、理解、推理、决策、学习、行动等能力 |
| 学科 | AI是一个知识领域,而非单一技术或产品 |
由此可知:AI是一个学科、一个技术领域,而非某一项具体技术。
三、AI作为学科的研究范畴
AI作为一门学科,研究的是“智能行为”的各个维度:
| 维度 | 研究内容 | 技术成熟度 |
|---|---|---|
| 感知 | 让机器识别图像、理解语音 | 较成熟 |
| 理解 | 让机器解析自然语言的语义 | 快速发展中 |
| 推理 | 让机器基于规则和知识进行逻辑推导 | 早期阶段 |
| 决策 | 让机器在不确定性条件下选择最优行动 | 较成熟 |
| 学习 | 让机器从数据中提取模式和规律 | 较成熟 |
| 行动 | 让机器执行数字或物理世界中的操作 | 较成熟 |
这六个维度共同构成了AI研究的完整范畴。大语言模型(LLM)主要在上述“理解”维度上取得了突破,并未覆盖AI的全部研究领域。
四、AI领域的主要技术分支
AI作为一个发展数十年的学科,已经产生了多种不同的技术实现路径。这些技术各有适用场景,不存在一种技术完全取代另一种的情况。
| 技术分支 | 诞生年代 | 核心原理 | 典型应用 |
|---|---|---|---|
| 规则引擎 | 1970s | if-then逻辑,专家知识编码 | 审批流程、合规检查 |
| 决策树 | 1980s | 树状决策模型 | 客户分群、信用评分 |
| 遗传算法 | 1970s | 模拟自然选择和进化 | 排产优化、路径规划 |
| 传统机器学习 | 1990s | 从标注数据中学习模式 | 销量预测、异常检测 |
| 深度学习 | 2010s | 多层神经网络 | 图像识别、语音识别 |
| 大语言模型(LLM) | 2020s | 海量无标注数据预训练 | 自然语言理解、内容生成 |
以上所有技术分支均属于AI领域。大语言模型是这一列表中的最新成员,但并非AI的全部。
五、大语言模型(LLM)的精确定位
大语言模型是AI领域中“自然语言理解与生成”这一研究方向上的最新技术成果。
核心原理:
在海量文本数据上进行预训练
学习语言的统计规律和模式
根据上下文预测后续内容,生成连贯文本
能力边界:
| 擅长的任务 | 不擅长的任务 |
|---|---|
| 理解自然语言意图 | 精确计算 |
| 生成人类可读的内容 | 确定性规则执行 |
| 文本摘要和翻译 | 保证100%正确性 |
| 辅助代码生成 | 理解真实语义(仅有统计规律) |
| 对话和问答 | 承担最终责任 |
结论:LLM解决的是“让机器理解人类语言并生成可读内容”的问题,不解决精确计算、确定性规则执行、业务逻辑处理的问题。
六、算力的真实角色
算力指计算能力,具体表现为CPU、GPU、TPU、算力集群等硬件基础设施。
算力与LLM的关系:LLM的训练和推理需要大量算力,算力是LLM的基础设施。
但需要区分以下两个命题:
| 命题 | 正确性 | 说明 |
|---|---|---|
| 算力是LLM的基础设施 | 正确 | LLM的训练和推理确实需要GPU等算力资源 |
| 算力是AI的基础设施 | 错误 | 规则引擎、决策树、传统机器学习等AI技术可在普通服务器上运行 |
当前部分基础设施提供商将“LLM的基础设施”宣传为“AI的基础设施”,这是一种商业推广策略,而非技术上的必然要求。
七、三层框架:AI、LLM、算力的关系
综合以上分析,可将三者关系归纳为以下三层框架:
| 层级 | 概念 | 本质 | 类比 |
|---|---|---|---|
| L1 领域层 | AI(人工智能) | 一个技术领域 | 物理学 |
| L2 技术层 | LLM(大语言模型) | AI领域中的一项具体技术 | 量子力学 |
| L3 基础设施层 | 算力 | 支撑LLM的底层基础设施 | 粒子对撞机 |
基于这一框架,可以得出三条基本结论:
AI ≠ LLM:LLM只是AI领域中的一项技术,而非AI的全部
算力 ≠ AI的基础设施:算力是LLM的基础设施,而非整个AI领域的基础设施
不应将L3等同于L1:购买GPU、训练大模型,不等于实施了AI转型
八、澄清常见误解
基于上述框架,可以识别当前讨论中常见的概念混淆:
| 常见说法 | 框架分析 | 实际情况 |
|---|---|---|
| “AI时代必须购买算力” | 将AI等同于LLM,将L3等同于L1 | 大量业务问题可用规则引擎和传统机器学习解决,不需要特殊算力 |
| “不使用大模型就不是AI” | 将L2等同于L1 | 规则引擎、传统机器学习等均属于AI,且适用于多数场景 |
| “AI将取代现有系统” | 高估了L2的能力边界 | LLM擅长交互层,不擅长执行层的精确业务逻辑 |
| “公司完成了AI转型” | 表述模糊 | 需要明确:使用了AI领域中的哪项技术?解决了什么具体问题? |
九、对企业技术决策的指导意义
基于上述概念框架,企业在进行技术选型时可以参考以下原则:
| 业务问题 | 适用的AI技术 | 所需基础设施 |
|---|---|---|
| 用户通过自然语言查询数据 | LLM(意图理解) | 调用API即可,无需自建算力 |
| 库存低于阈值时自动补货 | 规则引擎 | 普通服务器 |
| 预测未来销量 | 传统机器学习 | 普通服务器 |
| 优化生产排程 | 遗传算法 | 普通服务器 |
| 判断发票是否合规 | 规则引擎 + OCR | 普通服务器 |
| 生成报表摘要 | LLM(内容生成) | 调用API即可 |
核心原则:
针对不同的业务问题,从AI技术工具箱中选择最合适的技术
不应因为LLM是当前热点,就将所有问题都交由LLM处理
不应因为LLM需要算力,就认为所有AI应用都必须购买GPU
十、总结
本文的核心观点可以归纳为以下三条:
AI是一个技术领域,而非一项单一技术。其权威定义是“致力于让机器模拟人类智能行为的学科”。
LLM是AI领域中的一项具体技术,擅长自然语言理解与生成,但不擅长精确计算和确定性规则执行。
算力是LLM的基础设施,但不是整个AI领域的基础设施。大量AI技术可以在普通服务器上运行,无需特殊算力。
理解这三层关系,是正确讨论和应用AI技术的前提。
夜雨聆风