讲座回顾|“词与世界·Word & World”外国语言文学文化系列讲座第61期——大语言模型具有人性吗?

6月1日,我院“词与世界·Word & World”外国语言文学文化系列讲座第61期在线上举行。本次讲座邀请以色列耶路撒冷希伯来大学Yosef Grodzinsky教授担任主讲人,大学英语教学部教师王小丽主持。

讲座围绕“大语言模型是否具有人类语言能力”这一问题展开。讲座伊始,Grodzinsky教授从柏拉图《美诺篇》中的“学习悖论”谈起,回顾了语言习得研究中的两种代表性理论。以诺姆·乔姆斯基为代表的先天论认为,人类天生具备部分语言知识,语言习得建立在这些先天能力之上;而以2024年诺贝尔物理学奖得主杰夫·辛顿为代表的联结主义则强调,大规模数据训练和统计学习能够使神经网络获得语言能力。围绕两种理论的分歧,教授进一步引出了当前关于大语言模型能力边界的讨论。

随后,Grodzinsky教授结合语言学测试案例,分析了GPT系列模型在语言任务中的表现。他指出,模型虽然能够在部分语法测试中给出正确答案,但这并不必然意味着其真正掌握了语言规则。围绕这一现象,他提出“GPT N问题”,即人们往往期待下一代模型解决当前模型存在的不足,并以此作为技术持续进步的依据。然而,这种基于规模扩展的发展路径是否能够触及语言能力的本质,仍有待进一步研究。结合具体案例,教授讨论了训练数据、语言知识与语言能力之间的关系,并对当前大语言模型的发展模式进行了反思。
谈及语言学与人工智能研究的结合,Grodzinsky教授认为,语言学研究所揭示的语言规律能够为模型设计提供参考,从而提升模型运行效率。他还介绍了部分结合语言学理论与神经网络模型的研究实践。例如,通过识别并干预LSTM(长短期记忆网络)模型中负责语法一致关系的关键节点,研究者能够观察模型语言能力的变化,并将其与失语症患者的语言表现进行比较。这类研究尝试从认知科学与人工智能交叉的角度探索语言加工机制。

互动环节,与会师生围绕失语症患者动词与名词加工差异、时空记忆表现不同等问题展开讨论。针对相关研究设想,Grodzinsky教授建议从患者语料的系统采集与量化分析入手,并表示未来有望进一步开展汉语语言障碍的合作研究。
本次讲座从哲学、语言学、人工智能与临床研究等多个视角探讨了大语言模型与人类语言能力之间的关系,介绍了当前相关领域的重要争议与研究进展,为师生理解语言认知机制及人工智能的发展提供了新的思考。


撰稿:陈瑶编辑:米晓颖
夜雨聆风