数学 与AI,其实AI本质上就是数学"落地"最极致的现代样本之一。
🔢 一、AI是如何从"具象→抽象"的?
现实中具象的东西——图片、语音、文字、点击行为——先被数学化:
现实对象 抽象成的数学对象
图像像素 矩阵 / 张量
词语 / 句子 向量(词嵌入 / embedding)
用户行为序列 概率分布、图结构
决策环境 状态–动作–奖励(马尔可夫决策过程)
这一步本身就是数学的力量:把千差万别的现实现象,统一成同一类可运算的结构。
🧮 二、AI核心算法 = 纯数学在"抽象世界"里推演
训练一个神经网络,背后几乎全是经典数学分支:
- 线性代数:矩阵乘法、特征值、奇异值分解——网络每一层本质都是线性变换+非线性激活
- 微积分 / 多元分析:梯度、链式法则(反向传播)、凸性讨论
- 概率论与统计:最大似然、贝叶斯推断、交叉熵损失、分布拟合
- 优化理论:梯度下降及其变种(SGD、Adam),收敛性分析
- 信息论:熵、KL散度——用来衡量"预测有多偏离真实"
- 图论 / 拓扑(较新):GNN、流形学习,把数据看作高维流形上的点
这些都在高度抽象的数学空间里完成,人并不直接操作"猫和狗的图片",而是操作高维向量空间中的流形结构。
🔁 三、"再具象"——抽象结论回到现实
训练好的模型再映射回现实用途:
- 图像识别 → 医疗影像辅助诊断
- 语言模型 → 翻译、问答、代码生成
- 推荐系统 → 电商/内容分发
- 控制策略 → 自动驾驶、机器人
而每次落地,又会暴露新问题:
- 数据不够 → 催生正则化、数据增强、迁移学习
- 解释性差 → 推动可解释AI(XAI)、因果推断与概率图模型
- 算力/泛化瓶颈 → 刺激低秩近似、随机矩阵理论、神经正切核(NTK)等更深的数学研究
👉 这正是你所说的螺旋上升:
AI应用 ←← 倒逼新数学工具 ←← 再让AI能力升级 ←← 再催生新应用…
🎯 四、一个直观小例子:手写数字识别(MNIST)
1. 具象:你写个"5"
2. 抽象:28×28 像素 → 784维向量 → 经过多层矩阵变换+非线性映射 → 输出10维概率向量
3. 数学推演:定义损失函数(交叉熵),用梯度下降最小化它
4. 再具象:模型说"这是5,置信度98%" → 自动分拣、银行支票读取
整个流程没有一句"理解数字",纯粹是数学结构在模拟判别能力。
✅ 小结
AI 不是"脱离数学的技术",它恰恰是高维线性代数+概率论+优化理论,在大规模数据上的一次宏大实验。
数学提供抽象舞台,数据提供约束,AI则是两者碰撞出的"具象化智能工具"。
夜雨聆风