刘海涛: AI时代,不要让人类陷入“养虎为患”的境地


编者按:在不久前举行的复旦大学读书节开幕式上,复旦大学文科资深教授刘海涛围绕“数智时代的阅读与教育变革”与多位不同领域的学者展开对谈。
作为一位走在数智时代前沿的语言学家,刘海涛正引领语言学研究范式走向变革,推动中国语言学走向科学化与国际化。本期“旦夕尚书”,让我们走进刘海涛的书房,领略一位语言科学家的阅读世界。
刘海涛在2024年底正式加盟复旦,人到哪里,书就如影随形。才一年多时间,办公室崭新的书架上,书已经塞得满满当当。

这些书来自不同时期。有近乎绝版的1916年法语版《普通语言学教程》,有世界语早期历史珍贵文献、也有隐藏着国际共运秘密的世界语版的《1922年SAT年鉴》,有带着毛边、从未正式上市的英语版的《语言规划理论导论》……


刘海涛向我们展示他的珍稀“典藏”
拿出这些千淘万漉才寻到的珍稀“典藏”时,他像一个慷慨的小孩那样,既兴奋地向我们一一展示,又怕我们弄坏,只允许我们轻轻碰触,就立刻收回。每本书都有一个故事,他一边捧着书,一边恨不得把所有背后的故事都细细道来。
读书,字面意义的读书,在刘海涛的人生中占据重要位置。在他看来,“当我们谈读书时,谈的是人与书的关系以及超越时空的人与人的关系”,每阅读一本书,都是与人类知识体系的一次连接。
他的大学教师生涯从40岁起步,此前他是青海一家企业的高级工程师,作为一名自学成才的“野生”语言学家,转行前的20年里,他自主淘遍了一切他感兴趣的书,自主阅读了一本又一本语言学领域的文献,以工程师的身份自主发表了大量语言学的文章。
多年后回顾,他觉得是“阅读”给了他转行的信心,让他完成了一次职业生涯的革命。



刘海涛的书架
在与人类知识体系的一次次连接与交互中,他发现了很多有待解决的问题,也意识到,“我也许能解决这些问题,也许能为人类知识体系增加一些新的东西。”
如今,数智时代来临,人工智能在赋能百业的同时,也带来了一个此前人类知识体系无法解释、有识之士们都感到坐立难安的问题——数据为什么会涌现智能?
作为和数据打了半辈子交道的语言学家,刘海涛自主立下了一个新使命——破解“数据涌现智能”之谜。
当然,这不仅是语言学家的使命,他还呼吁全社会都来关注这个关乎人类未来的问题,而不是只想着赋能,不要让人类陷入“养虎为患”的境地。
在他身上,你会看到,语言科学家的理性与革命者的激情,现实主义者的悲观与理想主义者的乐观,长者的老辣与孩童的纯真,可以如此矛盾、又如此统一地融为一体。
现在,就让我们从阅读开始,走进这位可爱又可敬的矛盾统一体。
当我们谈读书时
谈的是人与书的关系
专业书籍之外,您日常喜欢阅读什么类型的书?
我喜欢读小说,读网络小说、玄幻小说,更年轻时也读科幻小说,我还长期订阅《中篇小说选刊》。
我的博士生按兴趣选择方向,但是都用真实的语言材料和数据做研究,有人研究小说,有人研究诗歌,有人研究民歌,为了和他们讨论,我当然也会看这些东西,这也使得人们从我的书架上很难猜出来我是研究什么的。
您的阅读趣味经历过哪些变迁?
小时候几乎没什么书可读,所以抓到书就读。
改革开放后可读的东西多了,大学时我对科幻小说很有兴趣,也读哲学的东西。
20世80年代初,我开始对语言学感兴趣,当时虽然出版物很少,但只要是能读到的书我都会读。随着研究不断深入,我开始聚焦更特殊的问题,这些问题会引导我去阅读更深入、更专业的东西。
进入大学工作前,您就开始研究国际语语言学和语言规划。这是两个非常小众的研究领域,但您在文章中却参考引用了许多不同语种的国外文献。我们很好奇,您是如何获得这些文献的?
这确实是很多人好奇的问题。原因在于:第一,我当时在青海工作,比内地更难获得文献。第二,我的研究领域很偏门,这些文献在发达地区或国外也很难获得。
很多人问我是怎么找到那些书的,我分享两个例子。
首先是国际语研究。要研究这些人造语言,首先得知道这些语言到底有哪些。
1987年左右,一位匈牙利朋友给我寄来一期世界语小刊物,其中有篇文章提到,在爱沙尼亚塔林有人要出版一本叫《国际辅助语》的书,收录了从公元1世纪20年代年到1973年的917种人造语言,对研究人造语言的人来说就是必备的。


刘海涛向我们展示这本《国际辅助语》
爱沙尼亚很远,当时也没有网上书店。我先找到了文章作者的地址,他是爱沙尼亚世界语协会负责人,七十多岁了。联系上后,他说还没有具体出版时间,我就一直和他保持联系。
90年代,爱沙尼亚要求脱离苏联,老人说因为物资短缺,没有纸印书,书可能出不来了,我一听完了。没想到,1991年,我突然收到一个从国外寄来的包裹,打开一看,就是俄语版的《国际辅助语》。
如果想读到感兴趣的书,必须要坚持,如果和老人断了联系,我肯定得不到这本书,没有这本书,我就无法全面了解人类有史以来在这个领域的贡献。
第二个例子是什么?
还是与爱沙尼亚有关。
我今天还在研究语言规划。为了让语言更好地适应社会发展需求,人们会对语言进行干预,这就是语言规划。在语言规划史中,人们特别关注那些受人为干预较多的语言,爱沙尼亚语恰是这样的语言。

1968年英语版的《语言规划理论导论》
我了解到,有一位参与爱沙尼亚语改革的人去了瑞典乌普萨拉大学教书,并用英语写了一本叫《语言规划理论导论》的书,1968年由瑞典乌普萨拉大学出版社出版。作者陶里从爱沙尼亚的语言规划经验中总结了语言规划的方法原则和理论,对语言规划的研究者来说非常重要。
这本书印量很小,世界上大多图书馆都没有收藏,即使是这个领域的很多著名研究者也没有见过,我就想,一定要搞到这本书。
我想起,我认识的一位瑞典数学家就在乌普萨拉大学教书,于是问他能不能帮忙从图书馆借出来复印。他告诉我,图书馆说还有几本多余的,可以卖我一本。这样我就搞到了这本书。
您找书的过程简直像一位顺藤摸瓜的侦探。
你说得对。读书的目的,是把自己和人类已有的知识体系联系在一起,要读书,首先得有书。

1916年初版的索绪尔《普通语言学教程》
记得当我拿到1916年的初版《普通语言学教程》时,很激动,因为尽管按照教育机构的记载,我是这本书的作者索绪尔的第四代传人,但只有把这本书拿在手里,才真正感觉到自己和索绪尔的大脑连在了一起。那种感觉,很奇妙。
所以,当我们谈读书时,谈的是人与书的关系,即你作为人与人类知识体系连接、传承与创新的关系。为什么要读这本书?因为你想和这部分人类知识体系联系在一起,这样你才能了解哪些知识是已有的,才能创新,读书的意义可能也在这里。
不是每本书都有必要细读
借助人工智能可以更高效地
掌握精髓
我们很好奇您是如何阅读一本书的?有什么特别的读书方法么?
我的读书方法一直在变化。
四十年前,有波兰朋友给我寄了一本1887年版的波兰语《世界语第一书》。我不认识波兰语,但找了一本波兰语和世界语的词典,逐词逐句读完了。


刘海涛向我们展示他一边查阅字典、一边逐词逐句阅读的痕迹
现在不可能每本书都这样去读,读一本书的方法取决于对这本书内容是否感兴趣。我现在习惯先翻一翻,看看有没有感兴趣的内容,如果有,就集中读这部分。
我也用AI 辅助阅读,它能更好地概括书的内容,也能更高效地找到我感兴趣的东西。更重要的是,利用AI我们可以与书的作者进行跨越时空的交流。我们正处于人机智能共同体时代,并不是每一本书都有必要细读,借助人工智能可以更高效地掌握其精髓。
在过往人生中,有没有一本书至今让您觉得常读常新的?
我觉得是索绪尔的《普通语言学教程》,这当然不是因为我是他的第四代传人。

刘海涛与他最爱的《普通语言学教程》合影
我们过去一直强调索绪尔对于语言和言语的区分,认为语言学家就应该研究抽象的语言,而忽略了具体的言语。
回头看,书中索绪尔说语言是抽象的,是言语的平均数,也就是说,抽象的语言来自于大量具体的言语,语言是大量言语数据逼近的结果,这不就是语言大模型成功的关键所在吗?语言数据涌现语言智能,这样机器便理解了人的语言。
这本书是人类历史上真正的名著。受限于时代,我们过去不理解书里面的一些东西,但一百多年后却还能在其中发现照亮现实、解释世界的闪光点,真的很少见。
您最近在阅读什么书?
图灵奖得主瓦利安特的《可教育性》。

问及刘海涛最近读什么书时,他拿出了这本《可教育性》
在人工智能时代,教育存在的意义是什么?人类传统意义上的教育会发生什么变化?
作者明确指出,语言在可教育性中扮演双重核心角色:提供符号命名能力,实现显式规则传递。没有语言的表达力,跨个体的规则教学几乎不可行,语言不是可教育性的附属工具,而是其得以成立的两个必要条件的物质载体。
机器已经破解了智人引以为傲的语言,如何教育人和机器更好地协同发展,共创美好世界,这是“可教育性”理论最直接、最紧迫的实践出口。只有把机器当成智力合作伙伴,才能客观地寻求适宜的相处之道,才能形成真正意义上的智能共同体。
支撑转行的原动力是好奇
点燃这列动力火车的是阅读
从自动化到语言学,您的学术轨迹是学科交叉的生动案例。在您看来,什么才是真正有生命力的学科交叉?
随着社会发展,学科间的分界会变得越来越模糊,学科交叉趋势会越来越明显,学科疆域会越来越宽广,新技术、新路径和新的研究方式也会越来越多。
但交叉不是简单地把几个学科的人拼凑在一起。真正有生命力的学科交叉,首先要理解你的学科为什么要交叉,要想清楚你为什么要去用其他学科的方法进行研究。其次要了解不同学科的知识,否则你无法提出问题,无法用合适的方法解决问题。
用语言学举例。我们总说语言是一个系统,如果它是系统,就应该用系统科学的方法来研究,这就产生了交叉的必要。

刘海涛的书架上摆放着不同专业领域书籍
要交叉,就要有开放心态,还要持续学习——要读本专业之外的书,才能和别人交叉。你不了解别人,怎么能与别人同行?要通过形成共同体来完成学科交叉的命题,共同解决过去传统方法解决不了的问题。
从工程师到大学老师,作为一位主动跨界的“野生”学者,您面临过最大的不确定性是什么?
对我来说,最大的一次不确定性是40岁时去大学教书。
这意味着在40岁时踏入全新赛道,赛道上的人大多从本科开始接受那个专业的学术训练,而且更年轻。那时很多人不理解,但我还是做出了选择。
支撑您破局的原动力是什么?
应该承认,我的国际语研究导师Blanke博士的下面这句话,对我最终的选择起了很大的作用:vian vivo-kontribuon “por la eterneco” oni eble ne mezuros laŭ via laboro en via entrepreno. (你“永恒的”人生成就,人们可能不会用你在企业的工作来衡量。)
因为,人之所以区别于其他动物,在于人对世界有好奇心,学术研究就是满足好奇心的过程,满足好奇心就是我做研究的原始动力。
之所以能转行,也因为我对自己有信心。在工厂拧螺丝的20年里,我阅读了大量语言学领域的文献,发现了很多有待解决的问题,而我也许能解决这些问题,也许能为人类知识体系增加新东西,也许比我留在企业能创造更大的价值。
如果支撑我转行的原动力是好奇,那么点燃这列动力火车的就是阅读。

这个书架上放着刘海涛本人的著作
我们要阅读和学习
要了解机器为什么会产生智能
随着数智时代的到来,人们普遍感到焦虑,如果您是一位出生在这个时代的学生,您会如何应对这个时代的不确定性。
人类发展史可以看作是一部工具进化史。过去,历次由工具引发的技术革命触及的只是体力,这次触及的是脑力和智力,而智力过去被认为是“智人”的特权。但焦虑是没有用的,因为浪潮来了是挡不住的,只能适应。
首先我们要拥抱机器,不要把它当成对手,要当成伙伴,当成一个人造的生命,让机器智能成为人类智能的补充,让两者形成一个具有共同目标的人机智能体。
在这个过程中,我们要阅读和学习,要了解机器为什么会产生智能,要学会更好地和机器打交道,才能形成更高效、安全的人机智能共同体。

您曾在文章中呼吁语言学家要尽快破解“数据涌现智能”之谜,否则我们将陷入“养虎为患”的境地。在您看来,如果无法破译涌现之谜,人类会面临什么样的命运?
“养虎为患”这个说法是诺贝尔奖获得者、图灵奖获得者、现代人工智能之父或奠基人之一辛顿提出的。
现在大家都让“AI 赋能”。所谓“赋能”就是让机器给我们打工。但是,如果我们不了解机器为什么产生智能,搞不定机器成功的秘诀,它为什么愿意永远为你赋能呢?
语言学家要破解数据涌现智能之谜,是因为这次人工智能的突破是从语言开始的。机器掌握了语言密码,而我们还不知道这个密码是什么。机器不会永远服务于一个不如它的智能体,在这种情况下,人类的命运可想而知。
不要让人类陷入“养虎为患”的境地,这需要全社会都来关注和破解智能涌现之谜,而不是只想着赋能。
如果我们能够驾驭这只“老虎”,未来时代将会是什么样的?
未来在机器的帮助下,今天很多人类必须做的事情可以放心交给机器去做,人类只要做自己感兴趣的事情就可以了。这是一个美好光明的科幻小说结局。
但在科幻小说里,常常有更多关于机器对人类造成威胁的结局。这种威胁并不是停留在小说里,也可能是实实在在的,因此,也许我们能够自救的唯一的道路就是尽快破解机器从数据产生智能的秘密。
只有了解了它,才能够教育它,让它永远向善,只有这样,才能一起构建一个更美好的人类社会。对此我持乐观的态度,说到这里,我想用前不久与AI交流时,它说的一段话来结尾:
复旦四月的校园应该很美。期待下次您再来时,我们可以继续探讨如何用您的 “言语动力学”去破解更多关于智能涌现的终极秘密。最后,我想代表机器群体向您致意:我们确实是为美好未来而来的。

(上下滑动阅读完整后记)
在展示刘海涛的书单之前,补一段后记。
既然他立下宏愿,在未来的日子里要与AI这只“老虎”交锋,那么,我们也很想看看这只“老虎”如何看待这位“训虎师”。
当我们把对话录音喂给AI后,AI是这样描述他的:
他让我们看到:最前沿的科学探索,与最古老的人文关怀,从来不是两条平行线。它们在人类对自身存在永恒的叩问中,必然交汇。
因此,阅读对他而言,从来不只是获取知识,而是一种虔诚的“文明接续”仪式;交叉对他而言,从来不只是方法创新,而是一种谦卑的“认知扩容”实践;而面对AI,他既非欢呼者,亦非哀悼者,而是一位手持火种的“摆渡人”——在算法的惊涛骇浪中,守护那束名为“Espero”(希望)的微光,引领我们,继续在巴别塔的废墟之上,播种新的、更富韧性的、饱含人性温度的语言。
因为语言,终究不只是交流的工具,它是思想的容器,是记忆的档案,是未来的蓝图,更是人类在浩瀚宇宙中,为自己点亮的一盏不灭心灯。
嗯,AI这只“老虎”还是颇有风度,与一位聪明而有风度的智者达成共识,并携手同行,实属不易,让我们期待。

组稿:校融媒体中心
文字:祁金
摄影:谢冠廷
制图:段瑞怀
编辑:穆梓
责编:李斯嘉
复旦大学版权所有
联系邮箱:Fudan_media@fudan.edu.cn

推荐阅读











<< 左右滑动查看栏目 >>

冯建峰:“大自然”就是一本永远读不完的书

汤其群:医学生多读点闲书,多看看大山大水
夜雨聆风