文/滴水湖点金树
2012年,加拿大多伦多。
一场学术比赛的会议室里,气氛紧张得能听见心跳。
这是ImageNet图像识别挑战赛——全球计算机视觉领域最重要的比赛。
会议室里挤满了人。
很多是来"观战"的——他们想知道一件事:
这个叫"深度学习"的新技术,到底行不行。
比赛结果是压倒性的:
冠军团队的识别错误率,只有26%。
而第二名,是61%。
差距是压倒性的。
这一刻,被称为"深度学习元年"。
从此之后,AI的历史,开始加速。
01 什么是深度学习
在说深度学习之前,先说一个所有人都能理解的比喻。
传统的机器学习,像是在"教小孩认猫":
你得告诉他:"猫有尖耳朵、圆眼睛、长胡子。"
他记住了这些规则,然后去认猫。
深度学习不一样。
你给它看100万张猫的图片,告诉它"这些是猫"。
不给它规则,让它自己去看、自己去学、自己去发现规律。
这个过程,叫"深度神经网络"的训练。
你可以把"深度神经网络"理解成模拟人脑的结构——有输入层、输出层,中间还有很多"隐藏层"。
这些隐藏层,就像人脑的神经细胞,会自动提取特征、自动发现规律。
这就是"深度"的含义——层数很多,能学的规律很深。
02 三个人的故事
深度学习的崛起,背后是三个"疯子"的故事。
第一个人:Geoffrey Hinton。
他1970年代就开始研究神经网络,在学术圈是出了名的"异类"。
因为那个年代,主流AI学界根本不认可神经网络——觉得这东西没有理论支撑,不可能成功。
Hinton不在乎。
他在加拿大的大学里,一边教书,一边研究,一边等机会。
这一等,就是四十年。
第二个人:Yann LeCun。
他1980年代在法国读博,研究用神经网络识别手写数字。
毕业后去了美国,在贝尔实验室工作——那是当时全球最顶尖的计算机研究机构。
他发明了一种叫"卷积神经网络"的技术,让机器识别手写数字的准确率,达到了99%以上。
这项技术,后来被全球所有银行采用——你写的支票,背后的数字识别,都是他的技术在驱动。
第三个人:Yoshua Bengio。
他1990年代在加拿大读博,研究用深度学习处理文本。
他的研究,让机器理解文字的能力,大幅提升。
这三个人的研究,在学术界被冷落了很多年。
因为那个年代,没有人觉得"让机器自己学"比"让人类写规则"更靠谱。
但他们坚持了下来。

03 ImageNet:一把火点燃一个时代
深度学习能崛起,有一个人不得不提:李飞飞。
她是斯坦福大学的教授,也是ImageNet的创始人。
ImageNet是什么?
是一个图片数据库——里面存了超过1400万张图片,每张图片都标注了"这是什么"。
为什么要做这个?
因为李飞飞相信:要让机器学会"看",得先给它足够多的图片。
就像教小孩认猫,你得让他看足够多的猫,他才认得出来。
2009年,她发布了ImageNet数据集。
但发布之后,没什么人用。
她做了一个决定:举办一场比赛。
让全世界的团队,用ImageNet的数据训练模型,看谁的识别率最高。
这就是ImageNet挑战赛的由来。
2012年,这把火终于点燃了。
因为Hinton团队用了深度学习,效果远远超过传统方法。
从那之后,所有参赛队伍都开始用深度学习。
ImageNet比赛的历史,到2017年就结束了。
因为到那时候,机器的识别错误率已经降到了2.3%——比人类的5%还要低。
机器"看"得比人准了。

04 资本的疯狂涌入
2012年之后,AI领域开始疯狂吸金。
Google出手了:
2013年,收购Hinton创办的公司DNNresearch 2014年,收购DeepMind(就是后来做出AlphaGo的那家公司)
Facebook出手了:
2013年,聘请Yann LeCun担任AI研究院院长
百度出手了:
2013年,成立深度学习研究院 2014年,挖来斯坦福教授吴恩达担任首席科学家
中国的AI创业热潮,也开始涌动:
商汤科技:2014年成立 旷视科技:2014年成立 云从科技:2015年成立
AI,正式从学术圈,走向了商业圈。

05 三大要素
深度学习的成功,靠的是三样东西。
业界称之为"三驾马车":
第一,数据。
深度学习需要海量数据来训练。
互联网时代积累的数据,正好派上了用场。
第二,算力。
深度学习需要强大的计算能力。
GPU的普及,让训练速度提升了成百上千倍。
第三,算法。
深度学习的核心算法,经过几十年的积累,已经相当成熟。
再加上一些关键的技术突破(比如ReLU激活函数、Batch Normalization),让训练变得更加稳定高效。
这三样东西加在一起,就像点燃了一堆干柴。
火焰,迅速蔓延。
点金树说
深度学习的崛起告诉我们:坚持,是有价值的。
Hinton、LeCun、Bengio,被冷落了几十年。
如果他们中途放弃,就不会有今天的深度学习革命。
创业也是一样。
你的方向,可能暂时不被认可。
你的产品,可能暂时没有市场。
但只要方向是对的,坚持下去,总会有机会。
不过,"坚持"的前提是:方向得对。
深度学习能成功,是因为它本质上比"专家系统"更接近智能的本质——让机器自己学,而不是让人教它学。
找到那个"更接近本质"的方向,比盲目坚持更重要。
滴水湖点金树创业孵化器
方向比坚持更重要,方向对了,坚持才有意义
#AI发展史 #深度学习 #Hinton #ImageNet #点金树

夜雨聆风