为什么当前所有AI教学工具都在假装对话

你有没有注意到，现在几乎所有AI教育产品都在宣传自己是"对话式教学"？并且都说自己用了“苏格拉底式对话法”，或者做了一个“AI苏格拉底”智能体。

Khanmigo说自己是"AI苏格拉底导师"。各种教育智能体都标榜"通过对话引导学生思考"。

我们自己做的产品也不例外。我2024年做的第一个智能体就叫“AI苏格拉底”。

但我们都在假装对话。

我们做的不是对话，是发邮件。

一封邮件来，一封邮件回

想象一下当前AI教学工具的交互流程：

学生打完一段话，点发送。AI思考三秒钟，输出一大段回复。学生读完，再打一段话。AI再思考，再输出。

这是对话吗？

这是发邮件。一封来，一封回。中间隔着一道无形的墙——你说完我才说，我说完你再说。

而真正的对话从来不是这样的。

苏格拉底的对话是什么样的

我带了130多期《理想国》精读。

在真正的苏格拉底式对话中，发生的是这样的事：

一个参与者正在表达自己的观点，说到一半，我从她的措辞中听出了一个未被审视的预设。我不等她说完——不是打断，而是在她思维流动的那个瞬间，抛出一个追问："等一下，你刚才说'本来就应该这样'——这个'本来'是从哪里来的？"

她愣了一下——不是因为我给了她一个答案，而是因为她突然发现自己思维中有一个从未检查过的角落。

这就是苏格拉底式对话的核心：它发生在思维流动的实时缝隙中，不是在思维结束之后。

真正的对话不是引导学生走向预设结论，而是和学生一起走向尚未被发现的地方。

但这需要一个前提条件：实时性。

沟通的三个基本要素，（现在的）AI一个都没有

1991年，语言学家Clark和Brennan在他们的经典论文《沟通基础》中提出，有效沟通依赖三个要素：

共存性（co-presence）——双方在同一个空间中，能看见彼此的表情、姿态、犹豫。

即时性（simultaneity）——一方说话时，另一方在实时感知，而不是等对方说完才开始处理。

同步性（sequentiality）——对话的节奏是流动的，随时可以打断、追问、补充、修正。

现在的AI教学工具，这三项全不具备。

它看不见你皱眉。它不知道你在打字到一半时停下来犹豫了。它无法在你说到关键词的瞬间追问。它只能等你按下回车键，然后处理你已经"完成"的文字。

这不是对话。这是异步通讯。

隐性知识的封锁线

1945年，经济学家哈耶克在《知识在社会中的运用》一文中提出了一个深刻的洞察：人类拥有大量基于特定时间和地点的隐性知识，这些知识无法被结构化表达，只能在互动中流动。

教育中充满了这种隐性知识。

一个学生的困惑不一定能用语言表达。有时候它表现为一种沉默，一种欲言又止，一种"老师我不知道自己不知道什么"的迷茫。有经验的教师能在这些微妙信号中读出信息，然后用一个恰到好处的问题，帮学生把隐性的困惑转化为显性的问题。

但这一切，只能发生在实时交互中。

轮询式的AI对话界面，本质上在学生和AI之间架设了一条封锁线——只有能被打成文字、被结构化表达的知识才能通过。而那些最需要被对话触及的东西——模糊的直觉、半成型的想法、说不清楚的困惑——全部被挡在了封锁线的另一边。

Thinking Machines Lab的预言

前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab最近发布了一项研究，核心论点直指行业的集体盲区：所有人都在追求AI自主完成长时任务的能力，却没有人在优化人机协作的交互界面。

他们提出了"原生实时交互模型"的概念——交互能力不应该是外挂组件（语音识别+打断检测+多模态拼接），而应该是模型本身的原生基因。

如果交互能力真的成为模型的原生能力，意味着什么？

意味着AI可以在你说话的过程中感知你的犹豫，在你打字到一半时判断你的方向，在你还没按回车键之前就开始准备追问。

那么AI就更像苏格拉底了。

对我们的意义

承认"我们在假装对话"不是自我否定，是自我清醒。

知道差距在哪里，才能知道方向在哪里。

当前阶段，我们能做的是在"发邮件模式"的框架内，尽可能逼近真正的对话精神——不是等学生给出完整回答再追问，而是设计"分步式追问"策略：先问一个小问题，根据学生的第一个反应决定下一个问题，把大对话拆成密集的小回合。

但更重要的是，当原生实时交互模型真正到来时，我们要能够使用它建构真正的人机对话，以及人机对话式学习。

在那之前，我们至少应该诚实：

我们现在做的不是苏格拉底式对话，我们做的是苏格拉底式书信。

它有价值。但它不是对话。

把这个区别看清楚、说清楚，本身就是苏格拉底精神。

本文使用AI学术助手辅助撰写

在自然学东西做大人