AI 介入的时间点,正在改变我们的思考

AI 介入的时间点，正在改变我们的思考

原文题目：Investigating the Effects of LLM Use on Critical Thinking Under Time Constraints: Access Timing and Time Availability
中文译名：在时间限制下使用 LLM 对批判性思考的影响：AI 介入时机与任务可用时长
作者：Jiayin Zhi, Harsh Kumar, Mina Lee
来源：CHI 2026
时间：2026-03，arXiv:2603.08849v1
说明：本文为论文摘要与 Introduction 部分的中文编译稿。

大语言模型对批判性思考的影响，已经引发了越来越多关注。但这种影响并不一定是单向的：它既不总是负面的，也不总是正面的。尤其是一个关键因素常常被忽略：任务中的时间条件。

这里的时间条件既包括 AI 在任务中什么时候开放，也包括任务本身留给参与者多少时间。

在一项 393 人参与的组间实验中，研究者考察了两类时间条件如何影响批判性思考任务中的 LLM 使用。这个任务要求参与者阅读多份材料，并基于这些材料，为一个真实世界情境做出有理由的决策。

研究者操控了两个因素。

第一是 AI 介入时机。AI 不是简单地「能用」或「不能用」，而是在任务的不同时段开放。研究者把它分成四种情况：

条件	含义
一开始可用 Early LLM access	AI 只在任务开始阶段开放，之后关闭。参与者可以先问 AI，让它帮忙理解材料、总结信息、打开思路，但后面必须自己继续完成。
全程可用 Continuous LLM access	AI 从开始到结束都在旁边。参与者随时可以问 AI，让它总结材料、解释信息、列正反观点，甚至辅助组织短文。
最后阶段可用 Late LLM access	任务前面不能用 AI，参与者必须先自己读材料、形成判断、开始写。到最后阶段，AI 才开放，可以用来查漏补缺、补充反方观点、确认论证。
完全不可用 No LLM access	全程没有 AI。参与者只能自己阅读材料、判断来源、形成论点和完成写作。

第二是 任务可用时长。参与者到底有多少时间完成任务？研究者设置了两种情况：时间不足是 10 分钟，用来制造真实的时间压力；时间充足是 30 分钟，允许参与者更从容地阅读、比较和思考。

研究发现了一种「时间反转」现象：当参与者处于时间压力下时，从一开始就能使用 LLM，或者全程都能使用 LLM，会提升他们的任务表现；但当任务时间充足时，同样的早期或全程 LLM 介入，反而会降低表现。

相反，那些先独立开始任务的参与者，也就是只在后期使用 LLM 或完全不使用 LLM 的人，则呈现出相反模式：他们在任务时间充足时表现更好。

这些发现说明，时间条件会根本性地影响 LLM 到底是在增强还是削弱批判性思考。因此，在设计 LLM 支持系统、评估人机协作中的认知任务时，不能只看有没有 AI，也要看 AI 什么时候介入，以及人有没有足够时间自己思考。

批判性思考，是指一个人能够面对多样且有时相互冲突的信息，通过分析、评估和综合，形成有理由的判断。这种能力对我们的工作和生活都很基础。

在今天的线上信息环境中，无论是面对互相冲突的新闻，还是基于零散文件做判断，人们经常会遇到需要批判性思考的情境。我们需要把这些经过推理得出的结论，用在不同目的上：解决一个问题、决定一个行动，或回答一个具体问题。

这个过程包括：从相关来源中提取有论证价值的信息，分析信息来源是否可信，避免偏见，并且简洁地表达自己的推理过程。

随着生成式 AI，尤其是大语言模型，越来越多地被整合进信息技术中，批判性思考也越来越容易受到它们的影响。事实上，在用户带给主流 LLM 聊天机器人的任务中，批判性思考是最经常被要求的能力。

已有一些用户研究为 AI 使用和批判性思考之间的关系提供了初步洞察。例如，有研究收集了知识工作者在不同工作任务中使用生成式 AI 时如何进行批判性思考的案例。也有混合方法研究考察普通用户如何感知自己的批判性思考能力，发现使用 AI 工具可能会降低他们的认知投入。

举例来说，AI 直接生成的摘要，可能会让用户不再需要自己理解原始资料，也不再需要自己评估证据。

不过，这些方法还不足以建立因果关系，也不足以客观测量实际表现。因此，AI 使用到底会带来怎样的表现后果，仍然不清楚。

除了用户研究和自我报告之外，我们还需要使用能够评估批判性思考表现的实验任务，来判断 LLM 的影响到底是如何实际显现的。

此外，LLM 对批判性思考的影响，可能并不是统一的负面或正面，而是取决于 LLM 被提供时所处的时间条件。

对于需要持续推理的认知任务来说，有两类时间限制对人机协作尤其重要。

第一，是 AI 介入时机。近期研究显示，在解决数学问题和创意写作中，较晚阶段使用 LLM 可能带来好处。不过，对于批判性思考来说，我们也有理由期待早期使用 LLM 可能有益。它可以作为一种前期支撑，处理一些准备性工作，比如收集可用信息、理解基本概念，从而可能释放认知资源，让人投入更深入的思考。

第二，是 任务可用时长。在实践中，人们经常面临时间压力，不管这种压力来自明确的截止日期，还是来自隐含的期待。已有研究表明，时间压力会影响认知表现，让人从审慎推理转向更依赖经验捷径的处理方式。

这两个时间维度在现实中本来就是相互作用的。但过去研究往往只单独考察其中一部分条件，而且分散在不同领域里。这样的研究图景仍然留下了重要空白：在真实任务中，当 AI 介入时机和任务可用时长同时发生作用时，时间限制究竟如何塑造 LLM 对批判性思考的影响？

在这项研究中，研究者考察了 LLM 如何在两类时间限制下影响参与者的批判性思考任务表现：第一，LLM 的介入时机；第二，任务可用时长。

研究者测试了四种 LLM 介入时机：Early、Continuous、Late 和 No LLM access。也就是说，LLM 分别只在任务开始时可用、全程可用、接近结束时可用，或完全不可用。

对于任务可用时长，参与者要么在时间不足的条件下完成任务，要么在时间充足的条件下完成任务。

基于这些时间条件，研究者提出了两个研究问题：

RQ1：在不同任务可用时长下，LLM 介入时机会如何影响批判性思考任务表现？

RQ2：在相同 LLM 介入时机下，任务可用时长会如何影响批判性思考任务表现？

为了回答这些问题，研究者进行了一项预注册的 4 × 2 组间实验，参与者人数为 393 人。

实验采用了 iPAL 框架，也就是 International Performance Assessment of Learning。这个框架用于评估真实情境中的批判性思考表现。

研究者使用了一项批判性思考表现评估任务。这个任务要求参与者基于一组特征不同的材料，为一个公共生活中的真实世界场景做出有理由的决策。

参与者需要在这些材料中浏览、分析，并从证据中推理；他们还需要评估信息来源，并把相互冲突的观点综合起来，写成一个有理由的书面决策。这个过程能够捕捉批判性思考中非线性、相互往返的心理过程。

在时间不足或时间充足的条件下，参与者被随机分配到四种 LLM 介入时机之一，并完成任务。研究者主要根据任务中的短文来评估表现。

此外，研究者还测量了参与者在三个方面的表现：回忆，也就是记住给定材料；评估，也就是判断来源材料的特征；以及理解，也就是基于证据推理来理解材料。这些指标用来捕捉可能影响批判性思考的认知活动。

任务结束后，参与者还完成了一份批判性思考自评。

总体而言，研究结果表明，LLM 使用对批判性思考任务表现的影响，根本上取决于 LLM 介入时机和任务可用时长。

对于第一个研究问题，在时间不足的条件下，从一开始就能使用 LLM，也就是 Early 和 Continuous LLM access，会提升参与者的短文表现；相比之下，先独立工作的参与者，也就是 Late 和 No LLM access，表现较弱。

但在时间充足的条件下，这个模式发生了明显反转：那些先独立工作的参与者，表现出更好的短文成绩。

此外，在时间充足时，从一开始就能使用 LLM，也就是 Early 和 Continuous LLM access，会损害参与者的回忆表现。这说明，AI 从一开始介入，可能会阻碍人对原始材料的内化。

对于第二个研究问题，时间充足会显著提升先独立工作者的短文表现和回忆表现；但对那些从一开始就能使用 LLM 的参与者来说，时间变多带来的帮助很小。

与此同时，参与者的自我评估在不同条件下差异很小。这说明，自评可能很难发现 LLM 在不同时间条件下对批判性思考造成的影响。

研究者进一步分析了参与者和 LLM 的互动记录，以理解这些结果背后的机制。

这项研究表明，在讨论 LLM 对批判性思考的益处或危害时，考虑时间限制非常重要。

具体来说，研究作出了以下贡献：

▪ 第一，提供了关于 LLM 对批判性思考影响的丰富实证发现。它不再只是简单比较「使用 LLM」和「不使用 LLM」，而是进一步区分不同的 AI 介入时机和任务可用时长。

▪ 第二，为需要批判性思考的任务如何设计 LLM 支持提供建议。

▪ 第三，为人机协作研究提供启示，强调研究者需要考虑时间限制。