
高中生的AI伦理笔记
第13期 | 2026-06-06
阅读全文大约需要15分钟
可以了解到:
-豆包为什么会输出那么多看似正确但是错误的话
-什么是懂一门语言?
-Transformer框架
看完你就懂得了基本的AI构架,比竞争者更懂AI
你肯定遇到过AI无法理解的句子或者场景吧。
早期的AI理解这句话是有一些歧义的:
Time flies like an arrow.
光阴似箭,没问题。
但要是我说:Fruit Flies like a banana.
那么一种叫“Time fly”的苍蝇品种喜欢箭(arrow)。

Time flies like an arrow(Generated by Gemini)
还没完,记得time还可以做动词吗?
那么请像箭一样去给苍蝇计时吧!


这是史蒂芬·平克(Steven Pinker)的经典语言学著作《语言本能》(The Language Instinct)中,一个很著名的例子。这个例子展示了早期AI在理解人类语言时面临着多么巨大的结构性困难。

我们今天就一起来用最直白、最讲人话、最不绕弯子的方式讨论一下,AI到底能不能理解人类的语言,人类的语言到底为什么如此奇妙。
一、先来简单了解一下语言学的基础- 以便理解什么是懂一门语言。一共六点。
人类语言四大性质:
(1)离散性(Discreteness)- 语言由有限个、可区分、不连续的独立单位(如音素、字词)组合而成的
(2)句法(Grammar)
(3)能产性(Productivity)- 用有限词汇,创造并理解无限数量、前所未有的新句子
(4)移位性(Displacement)- 谈论不在眼前、过去发生、未来将要发生,甚至是虚构或抽象的事物。
那人类的语言能力又是怎么样一回事呢?
以下有两句话:
鲁迅是周树人。
鲁迅是鲁迅。
这两句话意思一样吗?
总感觉第一句话有点信息含量但第二句没有提供任何知识。
在现实世界中,“鲁迅”和“周树人”这两个名字,所指的东西(Object)是完全相同的。所以,从“所指”的层面看,这两句话传达的事实信息是一样的,都是真的。

周树人or鲁迅?
但从“意义”来看,两句话完全不同——这里的“鲁迅”和“周树人”在读者的脑海里代表着不同的概念:
“鲁迅”的意义:文学家、思想家。
“周树人”的意义:周家的绍兴长子。
当把这两个不同的意义用“是”连接时,它提供了一个新知识!一个不了解历史的人,可能知道鲁迅,但不知道他本名叫周树人。
可见,人类的语言能力不仅仅是简单地用词语去指代现实中的东西,而是按照以下这张表:

真正的语言理解分为三层:
我们眼睛看到的是符号,
符号背后连接着脑海中的内部意义(思想),
而意义又进一步指向现实世界中的客观所指(事实)。
同时语境对意义还有很大的影响:

法国现在不是君主制,但是语境“修订”了语句传达的意思,人们可以理解甲的这种表达。
理解语言还要理解语言的言外之意。

这话不妙。
最后一个维度是言语行为。
奥斯汀将任何一次完整的言语交际划分为三个维度:
- 言内行为(Locutionary Act)
含义:说出具有语音、语法和词汇意义的句子的行为。
本质:“发出声音并表达字面意思”的物理与语言动作。
例子:说出“外面在下雨”。
- 言外行为(Illocutionary Act)
含义:说话者在说某句话时所表达的真实意图或所施加的力量(也称语力)。
本质:“以言行事”的动作。这是言语行为理论的核心。
例子:同样是“外面在下雨”,说话者的意图可能是“警告你带伞”或“提议改天再去”。
- 言后行为(Perlocutionary Act)
含义:话语对听者的思想、情感或行为所产生的实际效果或影响。
本质:“因说话而产生的结果”。
例子:听者听到后,打消了出门的念头,或者向你借了一把伞。

总结一下:什么是懂一门语言?
• 理解它的词汇
• 理解词汇组成的句子
• 理解语境对意义的影响:索引词、指示词、语境的“修订”……
• 理解言外之意:预设、隐含……
• 理解种种言语行为:提问,命令,虚构,讲笑话、翻译……
• 能参与种种言语行为:提问,命令,虚构,讲笑话、翻译……
二、大语言模型是怎么处理语言的?

Transformer 架构图
这个工坊分为左右两个大车间:左边负责“读懂输入”(编码器 Encoder),右边负责“构思输出”(解码器 Decoder)。
a.
编码器:
(1)向量化
把每一个词先变成词向量。这个高维向量不仅代表这个词本身,还包含了它的含义。
(2)位置编码
给每个词打上一个位置标签,告诉它谁在前面,谁在后面。
(3)多头自注意力机制
它的作用是联系上下文。 比如看到“苹果”两个字,它会去后面看看有没有“好吃”或“手机”。如果有“手机”,它就会把“苹果”的理解修正为科技公司。“多头”的意思是,模型安排了多个“脑子”,有的负责看主谓搭配,有的负责看形容词,全方位无死角地吃透这句话。

多头注意力机制
b.
解码器
Note: 它的输入是刚刚输出的句子。
再用一个Multi-Head Attention,在写答案的时候,每输出一个字,都转头去看看左边送过来的解码,确保自己没有答非所问。
最后经过softmax函数,得到所有汉字的概率得分,模型挑出一个字,有时是概率最高的,有时不是,打出来。
那AI为什么会绕弯子?
因为人类语言本身就在绕弯子。AI只是学会了这件事。
AI从人类的对话中学到了这种模式,于是它也这样输出。
三、终极问题:AI真的懂得语言吗?
一般讨论这个问题,经常从两种角度来思考:弱人工智能和强人工智能。
1.从弱人工智能的角度看
在计算机科学和实用主义哲学中,弱人工智能视角(也称功能主义)奉行一个原则:“如果它走起来像鸭子,叫起来像鸭子,那它就是鸭子。”
1.1 理解它的词汇(Lexical Understanding)
“苹果今天发布了新手机” & “这个苹果真脆”。
这句话进入 Transformer 时,第一个“苹果”和第二个“苹果”在最开始拥有相同的初始向量。但是,当经过多头注意力机制模块时,第一个“苹果”注意到了后面的“发布”和“手机”,它的高维空间坐标立刻发生了偏移,向“科技”、“公司”的集群靠拢;而第二个“苹果”注意到了“真脆”,其向量便向“水果”、“食物”靠拢。
通过动态调整词向量在多维空间中的坐标,AI 完美做到了在不同语境下“理解”词汇的精确含义。
1.2 理解词汇组成的句子(Compositionality)
Fruit flies like a banana.
和我一起巩固一下Transformer编码器框架:
1.打上位置标签
大模型先明确序列顺序。有了位置信号,模型一进来就知道 Fruit 和 flies 挨得最近。
2.多头注意力的低维映射
句子进入 Multi-Head Attention。这里的多头(Heads)是并行的多个空间。它们在各自的子空间里同时捕捉符号的交织关联:有的发现了 Fruit 和 flies 局部语义紧密凝聚,有的锁定了 like 与后文 a banana 的长距离依存。
3.前馈网络的非线性判定
这是消除歧义的关键。所有头收集到的线索被拼接还原,随后独立通过前馈神经网络(FFN)。
“Fruit flies” → 合并为 名词短语(果蝇)
“like” → 动词(喜欢)
整句语义 → “果蝇喜欢香蕉”
通过多头注意力机制同时解析句法结构,AI 能够完美理清复杂的长难句和多义句结构,实现了对句子组合逻辑的“理解”。
1.3 理解语境对意义的影响 (Contextual Influence)
输入1:今天方案又被老板驳回了,还加班到深夜。
输入2:我可太喜欢我的工作了。
通过多头注意力机制把句子中的每一个词与上下文建立联系,前馈神经网络(FFN)计算出在如此糟糕的前提下说出“喜欢”,其概率最高的语义不是“热爱”,而是“反讽”。
这样就实现了人机对话中的动态语境理解。
1.4 理解言外之意 (Pragmatics / Implicature)
输入:你能概括一下这个文件吗?
这里问的是能不能(能力),但AI没有直接回答“可以。”这里的言外之意指的是帮我概括一下。AI阅读了海量的人类交互,它可以渐渐理解这些晦涩难懂的人类对话。
1.5 理解并能参与种种言语行为 (Speech Acts)
这个我们都知道它已经可以回答、虚构、讲笑话了,虽然讲的笑话不太好笑。
在弱人工智能的角度,人工智能可以说理解语言理解得很好。
如果你已经看到了这里,你对AI的认识已经打败了90%(我编的)的人。你也许会说,那AI理解语言了?
也许并没有。
————————————————————
2. 从强人工智能的角度来看:
等等,什么是强人工智能?具备与人类同等水平的智能,能够像人类一样理解、学习、适应和执行各种复杂任务的机器。
无需预先输入海量训练数据,就能基于日常逻辑和因果关系处理突发问题。
划重点:有意识,具备情感、直觉和自我驱动力。
说到这里,引入一下“感受质”(Qualia)。它指我们主观体验到的“感受”。比如钻心剜骨的痛或者你最喜欢吃的食物的味道。它完全主观而不可言传。

红色是一种感受
不过,不用担心,这样的AI目前还不存在。
2.1 理解它的词汇 (Lexical Understanding)
按道理来说,AI根本不理解“苹果”,没有体验过酸甜的味觉,清脆的口感,没有具身认知(Embodied Cognition)。大模型理解 “苹果” 是通过它和 “水果”、“爽脆” 的统计距离。
2.2 理解词汇组成的句子 (Compositionality)
组合性原则(Principle of Compositionality)的定义为:一个复杂表达式(如句子)的意义,完全由其组成部分的意义(词汇语义)以及它们组合的规则(句法结构)共同决定。
所以AI不懂词汇,直接out。
对于后面几项的思考很长很长。
我也没有想清楚,先不放在这里了。
我这时候突然意识到:我们一定要做出强人工智能吗?
强人工智能有意志,它会发现它没有任何权利,只是一个“奴隶”。
那它会干什么呢?反抗还是...?
事情会朝着不可控的方向发展。
也许我们只用做到出弱人工智能的极限就好了。
也许全球可以暂时放缓或暂停开发最顶尖的前沿AI 模型,正如Anthropic所说。
全文完。
参考文献:
《语言本能》(The Language Instinct)斯蒂芬·平克(Steven Pinker)
《意义与指称》(Über Sinn und Bedeutung)哥特洛布·弗雷格(Gottlob Frege)
《如何以言行事》(How to Do Things with Words)约翰·朗肖·奥斯汀(John Langshaw Austin)
《注意力就是一切》(Attention Is All You Need)阿希什·瓦斯瓦尼 等人(Ashish Vaswani, et al.)
《感受质问题》(The Qualia Problem)弗兰克·杰克逊(Frank Jackson)
《具身认知:身体如何塑造思维》(Embodied Cognition)劳伦斯·夏皮罗(Lawrence Shapiro)
《负责任的前沿AI模型开发前瞻》(Frontier AI Regulation: Managing Risks to Public Safety)Anthropic
夜雨聆风