当前时间: 2026-06-03 11:40:36
分类:办公文件
评论(0)
为什么声称乔姆斯基对AI的批评意义不大意义不大我以为对于乔姆斯基的某些批评已经足够糟糕,没想到这里还有更糟糕的。...乔姆斯基批评AI,核心意思大致是:ChatGPT这类大模型只是统计匹配,不是真正理解语言;它们不能解释,不能像人一样掌握语言机制. 这个批评虽提醒我们不要神话AI,有启发性和现实意义,但说实在的,并无多大科学理论意义。因为它回避了一个更根本的问题:如果人类的语言机制不是统计匹配,而是另一种机制——比如就是乔姆斯基发明的那种机制,那这个机制最终能不能被机械化?所谓科学理解,从来不只是“知道它是什么”,更是知道它如何运行,并最终把这种运行过程外化、自动化、机械化。- LLM没有办法区分可能的语言与不可能的语言。这在实验上是有证据的,参考Moro(2016).
- 它需要大量的数据来掌握一门语言,这与儿童语言习得的方式不符。这也是有实验证据的,见Nur Lan, Emmanuel Chemla, Roni Katzir(2026).
其次,当我们在说“k阶逼近方法”没能恰当的逼近语言的时候,它是否有意义?读过乔姆斯基的“语言描写的三个模型”一文的同学大概都知道,这篇文章首先检验了有限状态马尔科夫模型和k阶逼近模型,后者,也就是所谓的统计匹配方法,源自香农(1948),香农自己甚至在书中举过逼近英语文本的例子,文章发现这两个模型都没有办法用作语法的模型;随后又检验了短语结构语法,发现短语结构语法也不充分,最后才提出了转换分析。显然,它是有价值的,因为它的不充分性引导着我们寻求更加合适的理论框架。现在的纯LLM只不过也是统计逼近吃上了类固醇,让一个老人家把自己70年前就证明了的东西拿出来重复重复再重复,那也是很折磨了。第三,作者显然对科学和工程有一点误解。科学追求的是理解,当然也包括它的运作机制。但是工程呢?工程是系统应用自然科学和数学知识来解决现实问题、满足人类需求的实践活动。作者所谓的外化、自动化、机械化指的如果是一个理论要能被转换成一套可操作的形式化指令,那他的批评显然不成立,因为生成语法一直以来倡导的就是形式化代数方法。另外一个稍微强一点的解读或许是,要求这套理论能够被做成可以在计算机上运行的模型,但是这显然不是科学的要求。举个例子说,计算机最初被发明的一个重要动因就是人们想要在计算和数据处理上省点力气,这是现实需求驱动的,计算机背后的科学理论使得计算机可以被发明出来,这是科学理论的使能功能(enabling function),但是这不意味着构建这套科学理论的目的是发明计算机。这一点就鲜明地体现了科学相比工程具有更加基础的地位。类似的,人工智能这个学科本质上应该关注的是人类智能的本质是什么,如果我们有一天找到了这个问题的答案,作为科学的人工智能的任务就完成了。我们要求形式化,仅仅是因为形式化之后的理论更加明晰、无歧义,这样大大便利了对这套理论的评估。但是并不意味着这套理论的目的是做一个智能体出来。第四,计算的数学理论在生成语法早期扮演了重要角色,我们常常谈到的乔姆斯基-舒岑伯格层级就是这一说法的重要体现,计算机科学及相关学科的同学可能在编译原理这门课程中也能碰到它。但是要注意,计算的数学理论的目标对象是线性字符串,而在最新的生成语法理论中,我们(至少谈到句法时)讨论的对象的是没有线性信息的层级结构,计算的数学理论当然不再是合适的理论框架。但是这不意味着乔姆斯基的理论不可以被机械化,这只是说明我们需要新的数学理论来承担计算的数学理论原先扮演的角色。第五,乔姆斯基从来没有说过语言就是思维。他的说法是语言首先是用来表达思维的,这意味着我们首先必须要有语言和思维两个不同的东西。语言学研究的终极目标,始终指向:找到一个计算模型,可以像人一样进行符号变换。“像人一样进行符号变换”是一个很模糊的说法,但是要么就是说产出和人类一样的输出,要么就是说具备和人类一样进行符号变换的能力。对于前者而言,这样的模型恐怕会有很多,一个最简单的例子恐怕就是一些数学题可以有很多种解法,但是这些模型不是每一个都符合人类语言的设计原则的,如果语言学是关于人类语言的一门科学,那么语言学最终的追求应该是对人脑中编码的语言官能的真实面貌的理解,至于它要不要落地,那是工程上的问题,不是语言科学的任务。这里的讨论有点类似于经典生成语言学时期强生成能力等价和弱生成能力等价的讨论,然而弱生成能力等价在生成语法中从来不是重点,因为可以生成同样字符串的语法太多了,但是不是所有的都是统一老坛酸菜牛肉面。对于后者来说,的确,这符合语言学作为对人类语言科学的要求,但是,模型本身也是一个很模糊的术语,它可以指理论模型,也可以是可以在计算机中运行的模型。而后一种解读,正如刚才已经说过的,是工程上的问题,不是科学的任务。虽然计算的数学理论在最新的生成语法中已经失去了往昔的地位,但是这不意味着这套理论已经完全无用。另外,说生成语言学没有计算模型是大错特错,忽略了Robert Berwick, Sandiway Fong等等等等诸多学者的贡献。 另外,最近还有一篇讨论统计逼近和通用智能关系的小文章,我列在往期回顾中,感兴趣的可以阅读一下。
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-06-03 11:52:04 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/704375.html
- 运行时间 : 0.108779s [ 吞吐率:9.19req/s ] 内存消耗:4,734.61kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=70ecc46dba5e0ee8c6203f4e64bd9faa
- CONNECT:[ UseTime:0.000601s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.000717s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.000735s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.005981s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.000603s ]
- SELECT * FROM `set` [ RunTime:0.002699s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.000634s ]
- SELECT * FROM `article` WHERE `id` = 704375 LIMIT 1 [ RunTime:0.000974s ]
- UPDATE `article` SET `lasttime` = 1780458724 WHERE `id` = 704375 [ RunTime:0.000764s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000303s ]
- SELECT * FROM `article` WHERE `id` < 704375 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000465s ]
- SELECT * FROM `article` WHERE `id` > 704375 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.000393s ]
- SELECT * FROM `article` WHERE `id` < 704375 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.002416s ]
- SELECT * FROM `article` WHERE `id` < 704375 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.001090s ]
- SELECT * FROM `article` WHERE `id` < 704375 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.001167s ]
0.110488s