神经网络发展了这么多年,现在已经挺智能了,不仔细识别都以为是人干的!它是怎么一步一步从low B发展成现在的高大上的呢?我们不妨回顾一下从神经网络的崛起到现在,整个路线到底是怎么样的一个故事。
神经网络的历史轨迹
神经网络大概可以分为4个阶段,神经网络酝酿期(1958之前)、经典神经网络(2012年前)、深度学习神经网络(2022年前)、LLM大模型(2022年后)。
Stage-1:神经网络(1958年前)
在1958年之前,基本可以说还没有神经网络仿生智能模型,只有个别简单的模型,例如M-P神经元模型。

但这段时间却为神经网络的发展积累了必要的土壤。例如计算机重要吧、神经学的研究重要吧、数学技术重要吧、仿生模型的思想重要吧。可以说,这段时期虽然没有神经网络,却准备了孕育的条件。
Stage-2:经典神经网络-薄积厚发(1985-2012)
在1958年到2012年(深度学习提出之前)这段时间,就是经典神经网络横行的时段了。这时候提出了许多小规划的神经网络模型,例如RBF神经网络、LVQ神经网络、BP神经网络、SOM神经网络、Hopfield网络、感知机、GRNN、PNN等等。今天你一个 、明天我一个,就有了一堆的经典神经网络。

这个时期的神经网络其实并没有体现出"智能"的感觉,其实大家想想也知道,这些小模型、哪来的智能呢!但是,它就像一个一个不同功能的小细胞、这就为以后发现大型的模型提供了各种不同功能的"小组件",例如"视觉类型"的、"时间序列类型"的、"拟合类型"的、等等等等,可以说,这是个积累期。
Stage-3:深度学习-渐露头角(2012-2022年)
在2012年,AlexNet打开了深度学习的大门之后,一系列的深度学习神经网络模型就提出来了,它的特点就是模型的层数特别的多,一般用来解决图像、文本问题。深度学习的神经网络模型主要如下:

CNN系列:LeNet、AlextNet、VggNet、GoogLeNet、ResNet、U-Net等等。RNN系列:Elman-RNN、LSTM长短期记忆循环神经网络、GRU门控循环神经网络、DRNN深度循环神经网络等等。
生成模型:VAE变分自编码器、RBM受限玻尔兹曼机、GAN对抗神经网络、扩散模型等等。
这时候的模型就开始有些"智能"的感觉了,例如"植物识别"类的小程序我到现在都还在用呢~可以说,它开始组合各种"神经元控件",使它越来越大、解决越来越复杂的问题了。
Stage-4:LLM大模型-爆炸期!(2022之后)
2022之后,chatGPT问世后,基本就是LLM的天下了,LLM一般可以认为起源于Transfomer。LLM比较多,基本一天一个都不过份,比较知名的有:GPT、Gemini、DeepSeek、通义千问Qwen等等。

LLM其实还是没有真正的智能,但它已经很很很很像"智能"了!
下一步,LLM又会引领我们到哪个新颠峰去呢?真是期待极了!!!!
夜雨聆风