
以人为研究对象的人机交互(HCI)和人工智能(AI)是新一代信息技术的典型代表。作为密切相关的学科,二者必须协同发展。《科技导报》邀请中国科学院软件研究所戴国忠、康文惠、田丰老师撰写文章,从“人机共生”的视角出发,分析了历史和当下AI和HCI发展中存在的问题,并提出了新用户界面(New UI)的技术设想。
2020年为信息技术发展的分水岭。第一代信息技术高潮被称为“数字化1.0时代”,其核心是将办公自动化和数字技术引入桌面工作场景。21世纪后,学术界围绕新旧信息技术展开深入讨论,焦点逐渐从以机器为中心转向以人为本。数字化2.0时代的目标是实现计算的普适化与智能化,使计算更贴近人的需求与能力。
在这一历史脉络下,新一代信息技术的典型代表逐渐显现,即以人为研究对象的人机交互(HCI)和人工智能(AI)。作为密切相关的姐妹学科,二者必须协同发展,携手推动以人为本的技术创新进程。正因如此,当下亟需在更系统的框架下审视二者的协同逻辑,即人机交互与人工智能的关系(“2I”关系)。当前面临2大关键挑战:一是如何有效推进数字化2.0时代的转型升级;二是如何构建符合人本理念的交互范式,实现以大模型为核心的智能技术的落地应用。为了应对这一挑战,新一代信息技术必须关注“用户想做什么”,遵循技术发展必须紧密契合用户需求,实现真正的人机协同,确保技术普惠而非成为少数人的特权。我们提出并强调“2I”关系健康发展的核心,为下一代信息技术的发展提供思考框架。

1 对新计算环境下人机交互的新认识
自1960年“人机共生”概念被提出以来,人机交互始终以“人与计算机协作完成任务”为核心,聚焦于人与系统在行为、认知和社会性层面的交互机制研究。然而,随着新一代信息技术的快速迭代发展,人机交互的核心驱动力正由单一的技术驱动转向由社会生产需求、技术综合进步与个人社交需求等多元因素共同推动的复杂机制。
尽管人机交互近年来随着新兴技术不断拓展其研究深度与应用边界,但其发展基础仍深受传统基础模型的影响。图灵机和冯·诺依曼体系为现代计算奠定了坚实的理论与结构基础。然而,这些基础模型在设计之初主要关注计算的可行性与逻辑实现,较少考虑人与系统间的实时交互需求。
人机交互的发展离不开交互范式的演进。技术革新推动交互范式的变迁,而范式的演化又反过来促进技术的发展,二者相辅相成、相互驱动。在这一过程中,关键的人物、事件与思想也发挥了重要作用,能够深刻影响交互范式的演进。将交互范式用于具体应用时,必须充分关注人的心理与认知特性。因此,应用系统的输入设计应该符合人的习惯,而输出应以降低人的认知成本和学习成本为目标,尽可能贴合人的认知机制。
21世纪以来,新的信息技术迅速发展,计算环境从单一的桌面计算,发展成多种计算环境。在这一发展与演进过程中,新范式和界面平台应在保证原有性能的基础上,呈现系统的决策逻辑与行为机制,通过增强可解释性推动人机协同,并促进人机能力的共生发展。
与此同时,人机交互的内涵已超越传统意义上人对桌面计算机的命令操作,逐渐拓展为具有人类意图表达和感知能力的“智能机器人”与能够同计算机实现自然交互的“交互人”之间的协同交互。在这一过程中,交互人和智能机器人应在感知、认知与行为3个层面实现协同与互相促进,构建起物理世界(自然界)与数字空间(互联网、物联网)之间的无缝交互桥梁。

2 对人工智能的若干认识
人工智能自1956年达特茅斯夏季研讨会首次提出以来,经历了2次高峰与2次低谷的发展周期。从理论演进来看,人工智能最初源于图灵对“具有独立思维能力的机器”的设想,逐步演变为一门以图灵理论为基础的系统性学科。
迄今为止,人们仍无法充分理解人类在解决问题过程中大脑的运行原理、认知过程,乃至心理发展,以及它们之间的相互影响机制。这种未知不仅使得“计算机如何模拟人类思维”成为人工智能研究的核心难题,也使得理清“脑−心灵−计算机”三元关系面临前所未有的复杂性挑战。
随着深度学习与大语言模型的发展,人工智能研究与认知科学之间的关系受到广泛关注。当代AI的若干核心机制在功能与方法论层面上,与认知科学关于注意、学习、预测与表征等问题的理论讨论呈现出一定的呼应关系。
尽管对人类大脑的理解仍处于初级阶段,但基于对大脑与人工智能的持续探索,学者已提出了诸多认知计算理论与模型。早在1937年,丘奇与图灵就分别提出了人的思维能力与递归函数计算能力等价的假说。与此相对,哲学家德雷福斯等则坚决反对这一观点,认为基于图灵机的计算模型无法模拟人类智能。
围绕上述问题,学界逐渐将讨论进一步引向对形式系统内在局限性的反思。哥德尔在20世纪初提出的不完备性定理正是这一反思的逻辑起点。从哲学和认知科学的角度来看,哥德尔不完备性定理不仅揭示了形式系统的内在局限,也促使人们重新审视“计算”与“智能”的边界问题,并成为人工智能哲学讨论中不可回避的重要命题。

3 人机交互和人工智能的关系
人工智能与人机交互为计算机科学中2个密切关联,但侧重点在不同的子领域。人工智能侧重于从算法和模型层面解决认知计算问题,试图模拟或重建人的智能过程;而人机交互则强调以人为中心的交互设计,着眼于人的感知、认知与行为特征,致力于通过理论与实践融合,构建自然、高效的人机协同体系。尽管两者在实现路径与方法论上各有侧重,协同构成了从智能建模到交互设计的系统性研究框架,但在目标层面具有高度一致性,即理解和服务于“人”的认知与行为需求。
基于这一认识,我们将AI与HCI的关系概括为“2I”关系,用于刻画智能系统从内部认知建模到外部人机协同实现的技术链条。
作为推动下一代信息时代发展的关键技术,“2I”关系对计算机科学领域的健康发展具有深远影响。然而,历史上这2个领域长期被独立关注,导致资源配置上的竞争与不平衡:在人工智能发展相对缓慢的时期,人机交互迅速发展;而在人工智能进入高速发展阶段后,人机交互的发展则显得滞后,最终造成前2次人工智能浪潮均因应用落地不足而告一段落。
2022年ChatGPT的问世加速了生成式人工智能的发展进程,并被视为第3次人工智能浪潮中的重要阶段性节点。有学者认为,以ChatGPT为代表的大语言模型标志着一种全新人机交互范式的形成,并在一定程度上推动了计算模式、认知协作方式与人机交互形态的协同变革。在人机交互领域,这一进程分别对应着交互范式的变革、多模态交互机制的形成、认知模型的构建,以及具身环境中的交互设计探索。
大语言模型是一种新的交互范式,而多通道交互和多模态大模型、具身交互和具身智能,体现了人机交互和人工智能在学术上的紧密关系和阶段分工。这一技术轨迹反映出2个核心趋势:一是,人们正在努力寻找实现大模型实际落地的关键路径;二是,这一演化清晰地揭示了人工智能与人机交互的内在学术关系。这是一个极具潜力的开端,显示出人工智能正在从封闭式智能向交互式智能演进的趋势。
早在21世纪初,人机交互领域就提出了“自然人机交互”概念,作为机器智能演进的重要起点和第1个奇点,强调如何让机器更准确地理解人类意图,更自然地辅助人类完成任务,乃至于让人类在使用过程中“忘记”机器的存在。
随着AI的高速发展,AI与HCI的关系正经历从割裂对立到融合协同的演化。AI在机器学习、自然语言处理与多模态理解等方面取得突破,推动HCI从传统的“响应式交互”转向“预测与引导式交互”。在此基础上,机器开始具备与人类共同感知、推理和决策的能力,形成人–AI协同或人智组队的交互模式。
在这一演化过程中,AI已由后台算力转变为重塑交互范式的核心驱动力。因此,当前的关键在于如何推动人工智能快速转化为显性的科技能力,并进一步融合人机交互的发展路径,共同催生下一代用户界面(即新交互范式)。“AI+HCI = New UI”正成为一个重要命题,期待新一代的用户界面出现,以真正契合人类认知和行为习惯。而在即将到来的“意图交互”新界面时代,必然也需要更契合这一范式的交互工具。笔式交互将会是新界面时代的核心交互工具之一。这一判断也在笔式用户界面平台中得到了具体体现。该平台体现了“2I”关系协同发展的应用实践。
从更长远的视角看,人工智能的目标不应局限于(或主要是)替代人类劳动,更应聚焦于让人回归到“人的脑力劳动”。因此,人机交互与人工智能不仅是学术上的并行学科,更在技术落地与应用推广中互为支撑。它们的关系与协同程度,直接影响整个计算机科学领域的健康发展。

4 AI+HCI=New UI
伴随AI在感知、理解、推理与可视化等技术的突破,HCI的核心理念由“工具性”向“智能协同性”转型。这一变革不仅重塑了UI的功能定位,也对其设计原则与认知逻辑提出了全新要求——以智能融合、认知共构与动态演化为核心。因此,“AI+HCI=New UI”的“New”不仅关乎视觉与交互形式的革新,更体现在设计理念、交互范式、智能属性与认知结构的系统性变革,标志着UI从“界面”向“认知模型”和“智能体”的跃迁。相较于以操作可视化、交互自然化或单一模型驱动为核心的既有界面范式,“New UI”更强调人工智能能力与交互机制在系统层面的协同演化。
这一范式转变在交互层面上体现为从显式指令逻辑向意图导向交互的过渡。这种新型交互突破了传统操作层的边界,通过自然语言、多模态输入及语境建模,重构了人机理解链条。UI由“被动响应”的容器转变为具备理解与共感能力的交互主体,在语义、情境与认知层面实现智能协同。
从设计哲学层面看,“New UI”的理论根基已由“以人为中心”转向“以人机共智为中心”。界面不再是单向服务对象,而是用户认知的参与者与外化体。借助AI画像、动态建模与持续学习等技术,系统可根据用户特征与任务语境动态演化,实现“千人千界”的自适应交互,从而构建认知增强型共智体系。
在技术路径上,AI的深度介入推动了UI从“人工设计”迈向“自主演化”。这一能力使UI由“静态产品”转为“可持续演化的交互生态”,实现“在使用中学习、在交互中进化”的逻辑,标志着软件生命周期的范式跃迁。
从研究脉络上看,“New UI”并非孤立提出,而是延续了合作式认知界面、混合主动界面与意图感知界面等研究方向中关于界面主动参与认知分工与决策支持的思想。由此,“AI+HCI=New UI”并非技术要素的简单叠加,而是对智能能力与交互机制协同重塑界面角色的概念性概括。
在认知理论层面,“New UI”的认知内涵正从传统的“信息加工”范式,迈向以扩充心智与分布式认知为理论支撑的认知共构框架。
“New UI”的终极形态体现为混合智能驱动的共智界面。它以“共智逻辑”为核心,推动人机关系由“主客体”走向“共生体”,由“操作逻辑”迈向“认知共构”的智能逻辑。

5 迎接人机共生新时代
人机关系的理解与实践不断深化。从早期以文字为工具的“字符式交互”,到GUI实现的人机命令式操作,再到当下由人工智能驱动的“协同交互”与“智能代理”,人机交互逐渐从“命令界面”转向“认知伙伴”。然而,进入21世纪以来,尽管人机交互在产业与应用层取得了显著成就,但在思想创新、理论体系、范式建构等方面仍显薄弱。基于“HCI+AI=New UI”的理念,推动界面从静态的视觉窗口转变为智能代理与用户之间的动态对话空间,进而实现“人机共生”。这不仅是技术层面的突破,更是对人与技术、人与社会关系的系统性再定义。人机交互研究应跳脱狭义技术视角,从人类文明是否存亡的角度去思考和理解。同时,站在技术与人文的交汇点上,更应以全球视野看待人机交互的未来发展。唯有在人文与技术、东西方智慧、科学与艺术之间建立对话机制,才能真正走向一个人与技术共融共生的未来世界。


内容为【科技导报】公众号原创,欢迎转载白名单回复后台「转载」
精彩内容回顾
《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的研究成果、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、科技新闻、科技评论、本刊专稿、特色专题、研究论文、政策建议、科技人文等。

夜雨聆风