
你有没有注意到,现在几乎所有AI教育产品都在宣传自己是"对话式教学"?并且都说自己用了“苏格拉底式对话法”,或者做了一个“AI苏格拉底”智能体。
Khanmigo说自己是"AI苏格拉底导师"。各种教育智能体都标榜"通过对话引导学生思考"。
我们自己做的产品也不例外。我2024年做的第一个智能体就叫“AI苏格拉底”。

但我们都在假装对话。
我们做的不是对话,是发邮件。
一封邮件来,一封邮件回
想象一下当前AI教学工具的交互流程:
学生打完一段话,点发送。AI思考三秒钟,输出一大段回复。学生读完,再打一段话。AI再思考,再输出。
这是对话吗?
这是发邮件。一封来,一封回。中间隔着一道无形的墙——你说完我才说,我说完你再说。
而真正的对话从来不是这样的。
苏格拉底的对话是什么样的
我带了130多期《理想国》精读。
在真正的苏格拉底式对话中,发生的是这样的事:
一个参与者正在表达自己的观点,说到一半,我从她的措辞中听出了一个未被审视的预设。我不等她说完——不是打断,而是在她思维流动的那个瞬间,抛出一个追问:"等一下,你刚才说'本来就应该这样'——这个'本来'是从哪里来的?"
她愣了一下——不是因为我给了她一个答案,而是因为她突然发现自己思维中有一个从未检查过的角落。
这就是苏格拉底式对话的核心:它发生在思维流动的实时缝隙中,不是在思维结束之后。

真正的对话不是引导学生走向预设结论,而是和学生一起走向尚未被发现的地方。
但这需要一个前提条件:实时性。
沟通的三个基本要素,(现在的)AI一个都没有
1991年,语言学家Clark和Brennan在他们的经典论文《沟通基础》中提出,有效沟通依赖三个要素:
共存性(co-presence)——双方在同一个空间中,能看见彼此的表情、姿态、犹豫。
即时性(simultaneity)——一方说话时,另一方在实时感知,而不是等对方说完才开始处理。
同步性(sequentiality)——对话的节奏是流动的,随时可以打断、追问、补充、修正。

现在的AI教学工具,这三项全不具备。
它看不见你皱眉。它不知道你在打字到一半时停下来犹豫了。它无法在你说到关键词的瞬间追问。它只能等你按下回车键,然后处理你已经"完成"的文字。
这不是对话。这是异步通讯。

隐性知识的封锁线
1945年,经济学家哈耶克在《知识在社会中的运用》一文中提出了一个深刻的洞察:人类拥有大量基于特定时间和地点的隐性知识,这些知识无法被结构化表达,只能在互动中流动。
教育中充满了这种隐性知识。
一个学生的困惑不一定能用语言表达。有时候它表现为一种沉默,一种欲言又止,一种"老师我不知道自己不知道什么"的迷茫。有经验的教师能在这些微妙信号中读出信息,然后用一个恰到好处的问题,帮学生把隐性的困惑转化为显性的问题。
但这一切,只能发生在实时交互中。
轮询式的AI对话界面,本质上在学生和AI之间架设了一条封锁线——只有能被打成文字、被结构化表达的知识才能通过。而那些最需要被对话触及的东西——模糊的直觉、半成型的想法、说不清楚的困惑——全部被挡在了封锁线的另一边。

Thinking Machines Lab的预言
前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab最近发布了一项研究,核心论点直指行业的集体盲区:所有人都在追求AI自主完成长时任务的能力,却没有人在优化人机协作的交互界面。
他们提出了"原生实时交互模型"的概念——交互能力不应该是外挂组件(语音识别+打断检测+多模态拼接),而应该是模型本身的原生基因。
如果交互能力真的成为模型的原生能力,意味着什么?
意味着AI可以在你说话的过程中感知你的犹豫,在你打字到一半时判断你的方向,在你还没按回车键之前就开始准备追问。
那么AI就更像苏格拉底了。
对我们的意义
承认"我们在假装对话"不是自我否定,是自我清醒。
知道差距在哪里,才能知道方向在哪里。
当前阶段,我们能做的是在"发邮件模式"的框架内,尽可能逼近真正的对话精神——不是等学生给出完整回答再追问,而是设计"分步式追问"策略:先问一个小问题,根据学生的第一个反应决定下一个问题,把大对话拆成密集的小回合。

但更重要的是,当原生实时交互模型真正到来时,我们要能够使用它建构真正的人机对话,以及人机对话式学习。
在那之前,我们至少应该诚实:
我们现在做的不是苏格拉底式对话,我们做的是苏格拉底式书信。
它有价值。但它不是对话。
把这个区别看清楚、说清楚,本身就是苏格拉底精神。
本文使用AI学术助手辅助撰写
在自然 学东西 做大人
夜雨聆风