课堂上那个最难讲清楚的问题
如果你在法学、新闻传播、社会学、公共政策、教育学或数字人文的课堂上讨论过 ChatGPT、文心一言、豆包 这一类大模型,大概率会被学生问到同一个问题:
它到底是"理解"了我的话,还是只是"猜"出来的?
这个问题难讲,不是因为答案有多高深,而是因为 学生看不见 AI 工作的过程。他们看到的永远是一整段答案——从屏幕上"啪"地一下冒出来的、看似完整的回答。这种黑箱式的呈现方式,让"AI 是不是真懂""AI 是不是有意识"这类讨论很难落到具体的机制上,最后只能停在直觉和立场。
其实 AI 是"一个字一个字"写出来的
大模型生成内容的方式,更接近一个 接龙游戏:
也就是说,它每写一个字,都会重新读一遍前面所有的内容。
这件事如果只是口头讲,学生很难有直观感受。课堂上你能看到的,往往是他们礼貌地点头,但眼神空洞——一种"好像懂了但又没懂"的状态。
这个教具做了什么
Next-Token Visualizer就是为这种课堂场景做的一个小工具。
它的使用方式很简单:
换句话说,原本"AI 一秒钟输出一整段"的黑箱,被它拆成了一个 可以逐帧回放的慢动作。学生能亲眼看到:
这就为课堂讨论提供了一个具体的抓手。你不再需要用比喻去解释"上下文""注意力""生成",可以直接指着屏幕说:"你看,它写下这两个字之前,是回头看了前面这几个词。"
它适合什么样的课堂
这不是一个为算法课设计的工具,而是为 那些不需要、也不想写代码的人文社科教师设计的:
学生不需要懂 Python,也不需要懂 Transformer。他们只要看见——"哦,原来它是这样写出来的。"很多本来抽象的讨论,会一下子有了落点。
怎么把它装到自己的电脑里
技术门槛被刻意压到了最低:
python app.py;localhost:5050,就能用了。整个工具完全在本地运行,不需要联网调用任何商业 API,也不会把学生输入的内容上传到任何第三方。这对那些涉及敏感案例、隐私话题、未成年人讨论的课堂来说,是个比较友好的特性。
一个必须说在前面的话
最后必须坦白一件事:这个工具是 教学辅助,不是模型可解释性研究工具。
它呈现的"前文影响"是基于一种近似的归因方法,只是一种近似,并不是模型内部推理过程的直接证据。它能帮你和学生建立起"AI 是怎么写字的"这种直觉,但它 不能、也不应被用来"证明"大模型究竟为什么这样输出。
项目地址:原文链接
夜雨聆风