AI 与人机交互:近期要闻汇总(截至2026.6.13)

本期要闻关键词：AI与人机交互。

发展动态与趋势

一、国内动态

（一）概述

本周国内 AI 领域产业政策与技术突破双轮驱动，核心产业规模已突破 1.2 万亿元，相关企业超 6200 家。

国家发改委明确将出台 AI 落地配套文件，以具身智能关键基础设施为抓手统筹 “6 张网” 建设，推动机器人 “进工厂、进商场、进家庭” 场景落地。

第八届北京智源大会密集发布前沿成果：全球首个通用世界基座模型 “悟界・Physis-v0.1” 实现物理规律理解突破，支撑具身智能、工业仿真等场景；心脏磁共振辅助诊断智能体诊断精度媲美顶尖专家，科研智能体可自主完成文献调研到论文撰写全流程。腾讯会议上线 3 秒时延 AI 同传功能，支持音色模仿，大幅提升跨境协作效率。

（二）趋势洞察

国内 AI 发展已从技术孵化阶段进入生产力重构的关键期，“人工智能 +” 连续三年写入政府工作报告，标志着 AI 正式成为核心生产要素，未来将深度渗透企业核心业务环节。

政策端重点向具身智能、AI for Science 等硬科技方向倾斜，基础设施建设与场景落地同步推进，预计 3 年内企业运营模式将以智能体为核心完成全面重构。

技术路线上，世界模型、多模态融合成为核心突破方向，“懂物理” 的 AI 系统将打破数字与物理世界的交互壁垒，带动医疗、工业、科研等垂直场景的规模化落地。

同时产业生态呈现开源化特征，国产大模型凭借开源生态逐步参与全球竞争，“十五五” 期间核心产业规模有望向 10 万亿元量级增长。

二、国际动态

（一）概述

本周全球 AI 领域政策与产业协同推进，监管与创新并行。

美国特朗普政府签署 AI 行政令，要求前沿模型发布前 30 天提交政府评测，OpenAI、Anthropic 等头部企业已确认遵守该规则；NSF 联合 NVIDIA 投入 7500 万美元开发开源科学 AI 模型，同时宣布投资建设 AI 可编程云实验室网络，聚焦生物技术与材料科学领域的自动化科研。

英国政府投入 4000 万英镑新建 AI 研究实验室，重点解决大模型幻觉、短记忆等核心缺陷，同时 Google DeepMind 宣布 2026 年在英国落地首个自动化科学实验室，依托 Gemini 驱动材料科学研发。

欧盟发布《云与人工智能发展法案》等技术主权一揽子计划，计划 5-7 年将数据中心容量扩大 3 倍，构建自主可控 AI 技术体系。

产业端 OpenAI 秘密提交 IPO 申请估值超 8500 亿美元，苹果 WWDC 推出 AI 增强版 Siri，并为小型开发者免除 AI 云服务费用。

（二）趋势洞察

全球 AI 竞争已进入体系化比拼阶段，各国均围绕 “安全可控 + 科研赋能 + 产业落地” 三大方向构建竞争壁垒。

监管框架逐步清晰，美欧英均建立政府与企业协作的安全审查机制，在防范风险的同时通过政策背书加速技术商业化，预计将进一步推动头部 AI 企业的资本扩张。

AI 与科学研究的融合成为核心战略赛道，从云端实验室到自动化科研平台的投入持续加大，AI 驱动的科研范式将大幅缩短材料、生物等领域的创新周期。

人机交互向自然化、场景化升级，Siri 等消费级 AI 助手体验迭代，同时职场 AI 应用的权益保障受到关注，英国智库呼吁建立员工参与 AI 决策的协商机制，未来人机交互的伦理与公平性将成为技术落地的重要考量维度。

十大要闻精选

（一）【国内・产业】我国人工智能核心产业规模突破 1.2 万亿元，正式迈向智能化发展新阶段

概述：据手机搜狐网于 2026 年报道，我国人工智能核心产业规模已超过 1.2 万亿元，相关企业数量突破 6200 家，预计 “十五五” 末将增长至 10 万亿元以上。2026 年《政府工作报告》首次明确提出 “打造智能经济新形态”，标志着我国经济发展正式从数字化阶段迈向智能化阶段，AI 已从辅助工具转变为核心生产要素，深度进入企业核心业务环节。

短评：该数据直观展现了我国 AI 产业的爆发式增长态势，“打造智能经济新形态” 的政策定位明确了 AI 作为新质生产力核心支撑的战略地位。产业规模突破万亿元不仅是规模层面的里程碑，更意味着 AI 已从技术探索进入大规模产业落地的关键周期，将为千行百业的数字化转型、生产率提升注入核心动力，也为全球 AI 产业发展提供了 “中国路径” 的参考样本。

（二）【国内・政策】发改委谋划出台 AI 落地配套文件，全面推进具身智能领域高质量发展

概述：据今日头条于 5 月 22 日报道，国家发改委在 5 月份新闻发布会上表示，正在谋划出台加快人工智能落地的配套文件，进一步加大要素保障；将以具身智能关键基础设施建设为抓手，统筹 “6 张网” 建设，加快具身智能训练基础设施和应用中试基地建设，推动具身智能 “进工厂、进商场、进家庭”，全面推进具身智能领域高质量发展。

短评：具身智能是 AI 从数字世界向物理世界延伸的核心赛道，也是全球 AI 产业竞争的下一个战略制高点。发改委明确将具身智能基础设施作为建设重点，从底层算力、中试基地到场景落地形成了完整的政策支持链条，不仅将为国内具身智能产业发展扫清基础设施障碍，更有望推动我国在新一代 AI 技术落地应用上抢占全球领先地位，带动机器人、工业自动化等相关产业协同升级。

（三）【国内・技术】2026 北京智源大会发布全球首个通用世界基座模型 “悟界・Physis-v0.1”

概述：据新浪财经于 6 月 12 日报道，第八届北京智源大会开幕，会上发布全球首个通用世界基座模型悟界・Physis-v0.1，核心技术从 “预测下一个词” 升级为 “预测下一个物理状态”，可理解重力、碰撞、因果逻辑，处理全模态信息，支撑具身智能、工业仿真等真实场景应用。同时发布的还有多模态神经科学大模型、AI 驱动药物发现模型等多项突破性成果，多个技术指标超越国际主流工具。

短评：“悟界” 系列模型的发布标志着我国在世界模型这一 AI 前沿领域实现了从跟跑到领跑的跨越，解决了长期以来 AI “不懂物理世界规则” 的核心痛点，为 AI 落地实体场景提供了核心技术底座。这类底层技术突破不仅将大幅提升我国 AI 产业的核心竞争力，更将推动全球 AI 技术路线从纯语言模型向 “认知物理世界” 的方向升级，具有里程碑式的技术意义。

（四）【海外・政策】英国政府投入 4000 万英镑成立国家级 AI 研究实验室，攻关 AI 基础缺陷

概述：据GOV.UK于 3 月 4 日报道，英国政府将成立新的国家级 AI 研究实验室，投入 4000 万英镑支持蓝 sky AI 研究，为研究人员提供大规模计算资源，重点攻关当前 AI 模型存在的幻觉、记忆不足、不可预测等基础缺陷，相关研究成果将应用于医疗、交通、民生等领域，巩固英国在 AI 领域的全球竞争力。

短评：当前大模型的幻觉、可靠性不足等问题已成为 AI 规模化落地的核心瓶颈，英国成立国家级实验室聚焦基础缺陷攻关，是全球 AI 治理从 “应用监管” 向 “技术根源治理” 延伸的重要信号。这类公共部门主导的基础研究不仅能够降低企业的技术攻关成本，更有望推动 AI 技术从 “可用” 向 “可靠” 升级，为全球 AI 安全技术发展提供公共技术成果。

（五）【海外・产业】谷歌 DeepMind 将在英国建立首座自动化科学实验室，聚焦 AI 驱动材料研发

概述：据 Google DeepMind 报道，谷歌 DeepMind 将与英国政府深化合作，2026 年在英国建立首座自动化科学实验室，专注于材料科学研究。实验室将完全集成 Gemini 大模型，通过机器人每天合成和表征数百种新材料，大幅缩短 transformative 新材料的发现周期，相关成果将应用于能源、医疗、制造业等关键领域。

短评：自动化科学实验室是 AI 与科学研究深度融合的标志性产物，将彻底改变传统材料研发 “试错式” 的低效模式，实现新材料研发的指数级提速。DeepMind 此举不仅将推动 AI for Science 领域的商业化落地，更可能带动全球科研范式的变革，进一步巩固英国在 AI 驱动科学研究领域的全球领先地位。

（六）【海外・安全】美国 AI 安全研究所与 OpenAI、Anthropic 签署合作协议，共建前沿模型安全评估体系

概述：据 NIST 于 2024 年 8 月报道，美国 AI 安全研究所与 OpenAI、Anthropic 正式签署合作协议，双方将联合开展 AI 安全研究、测试与评估工作，针对高级 AI 系统的各类风险领域开展探索性研究，相关评估结果将为 AI 安全标准制定、监管政策完善提供技术支撑，同时研究所将为企业提供模型安全改进反馈。

短评：该协议是全球首个官方机构与头部 AI 企业建立的常态化安全合作机制，标志着 AI 安全治理从企业自愿承诺走向了 “政产学研” 协同的实质性落地阶段。这套评估体系的探索将为全球 AI 安全监管提供可复制的实践经验，也为平衡 AI 技术创新与风险防控提供了新的合作范式。

（七）【国内・应用】微软与英矽智能合作推动 AI 药物研发范式落地，临床前研发周期压缩 70%

概述：据微软报道，英矽智能与微软展开深度合作，将端到端生成式 AI 药物研发平台 Pharma.AI 部署在 Azure 云基础设施上，结合 Azure OpenAI 能力开发新一代智能代理。该平台将传统药物研发 4.5 年的临床前周期压缩至 12-18 个月，目前已推进 29 个临床前候选化合物，其中 12 个获得临床试验批件，验证了 AI 在药物研发领域的规模化应用潜力。

短评：AI 药物研发是 AI for Science 领域商业化进展最快的赛道之一，英矽智能的实践证明了 AI 可以系统性降低药物研发的时间成本和资金成本，为解决罕见病、疑难病药物研发的 “高投入、高风险、长周期” 痛点提供了可行路径。微软与英矽智能的合作也将加速这类技术的全球普及，推动生命科学研究进入 AI 驱动的新时代。

（八）【海外・科研】加州大学伯克利分校发布 AI 基础模型双重用途风险评估框架

概述：据 Research UC Berkeley 报道，伯克利分校研究团队发布《AI 基础模型双重用途风险评估与管理框架》，针对基础模型可能被恶意使用的风险提出了全流程评估与治理方案，帮助 AI 开发者提前识别、防控模型被用于网络攻击、虚假信息生成、有害内容制造等风险场景。

短评：随着大模型能力的快速提升，其双重用途风险已成为 AI 治理的核心盲区 —— 同一模型既可以用于生产创造，也可能被恶意用于危害公共安全。伯克利发布的这套框架填补了 “技术源头风险防控” 的空白，从模型开发阶段就嵌入安全治理逻辑，为全球 AI 企业、监管机构提供了可落地的风险管控工具，对推动 AI 技术负责任发展具有重要的前瞻价值。

（九）【国内・社会】世界经济论坛发布 AI 教育就绪框架，系统性指引教育体系适配 AI 时代

概述：据手机搜狐网于 6 月 9 日报道，世界经济论坛发布《2026 年未来学习变革洞察报告》，指出当前 AI 已深度渗透教学场景，超六成学生借助 AI 完成课业，但教育制度更新滞后于技术迭代，带来认知能力退化、学术诚信崩塌等四大风险。报告推出四维 AI 教育就绪框架，从基础保障、机构能力、教学实践、学习体验四个层面为各国构建适配 AI 时代的教育体系提供指引。

短评：AI 对教育的冲击是全社会层面的系统性挑战，零散的技术应用限制、教学工具升级已经无法适配 AI 时代的教育需求。该框架提出的系统性转型方案，不仅为教育领域应对 AI 挑战提供了完整的行动路线，更将推动教育体系从 “培养知识记忆者” 向 “培养 AI 时代的创新者” 转型，对人力资本的长期发展具有深远的战略意义。

（十）【国内・技术】北大 5D 世界模型 EvoPhys-World 登顶斯坦福榜单，全程使用国产 GPU 训练

概述：据网易新闻客户端于 6 月 13 日报道，北京大学研发的 5D 世界模型 EvoPhys-World 登顶斯坦福相关技术榜单，该模型全程使用摩尔线程 MTT S5000 国产 GPU 完成训练，打破了高端 AI 模型训练依赖进口 GPU 的刻板印象。同期腾讯混元提出的 Stem 稀疏注意力算法，将大模型首字延迟降低 3.6 倍，被国际顶会 ICML-26 收录。

短评：该成果不仅是 AI 算法层面的突破，更验证了国产 GPU 已经可以支撑世界模型这类高端 AI 任务的训练需求，为我国 AI 产业摆脱底层算力依赖提供了关键的实践验证。算法与硬件的协同突破，将大幅降低我国 AI 产业发展的供应链风险，也为中小国家发展自主可控的 AI 产业提供了 “低成本、高可用” 的技术路径参考。

本期洞察分析

AI 与人机交互：从数字对话到物理共生，交互范式正在迎来第三次革命

（一）现象观察：交互边界正在被全面打破

本周的 AI 行业动态透出一个清晰的信号：人机交互正在跳出 “人给指令、机器执行” 的传统框架，向更深更广的维度快速渗透。

整个产业正在同时发生三个维度的边界突破。

首先是认知边界的突破。

北京智源大会发布的全球首个通用世界基座模型 “悟界・Physis-v0.1” 首次实现了核心技术路线的转向：从过去大模型 “预测下一个词” 的语言逻辑，升级为 “预测下一个物理状态” 的物理逻辑，能够理解重力、碰撞、因果规律等现实世界的底层规则。

无独有偶，北京大学研发的 5D 世界模型 EvoPhys-World 登顶斯坦福相关技术榜单，且全程使用国产 GPU 训练。这类 “懂物理” 的 AI 系统首次让数字智能拥有了理解真实世界的能力，打破了长期以来横亘在数字空间与物理世界之间的交互壁垒。

其次是场景边界的突破。AI 交互已经从消费端的闲聊、搜索，快速渗透到生产力核心场景。

在工业端，国家发改委明确将统筹具身智能 “6 张网” 建设，推动机器人 “进工厂、进商场、进家庭”，2026 年我国 AI 核心产业规模已突破 1.2 万亿元，相关企业超 6200 家，AI 正式从辅助工具升级为核心生产要素。

在科研端，谷歌 DeepMind 宣布 2026 年在英国落地首个 Gemini 驱动的自动化科学实验室，每天可合成和表征数百种新材料；英矽智能的 AI 药物研发平台已经把传统 4.5 年的临床前研发周期压缩至 12-18 个月，29 个临床前候选化合物中有 12 个已获得临床试验批件，科研人员与 AI 的交互正在彻底改变 “试错式” 的传统科研范式。

在消费端，苹果 WWDC 推出 AI 增强版 Siri，腾讯会议上线 3 秒时延的 AI 同传功能且支持音色模仿，跨境交流、日常设备使用的交互门槛正在被快速拉平。

最后是治理边界的突破。

交互的深度普及也推动治理规则向前延伸：美国特朗普政府签署行政令要求前沿模型发布前 30 天提交政府评测，AI 安全研究所已与 OpenAI、Anthropic 建立常态化安全评估机制；英国投入 4000 万英镑成立国家级 AI 实验室，专门攻关大模型幻觉、短记忆等影响交互可靠性的基础缺陷；加州大学伯克利分校发布了全球首个 AI 基础模型双重用途风险评估框架，从技术源头防控交互风险。从技术研发到落地应用的全流程，交互的规则体系正在快速成型。

（二）原因剖析：三重需求共同推动范式变革

人机交互的快速迭代不是偶然的技术演进，而是技术成熟、产业需求、政策引导三重因素共同作用的必然结果。

从技术底层来看，多模态融合与世界模型的突破解决了交互的 “理解瓶颈”。

过去的人机交互本质是 “转译”：人类需要把需求转化为机器能理解的代码、指令、关键词，交互效率受限于人类对机器规则的熟悉程度。

而如今大模型的自然语言理解能力已经接近人类水平，世界模型的出现更让 AI 首次拥有了对物理世界的常识认知 —— 当 AI 懂得 “杯子掉落会碎”“推重物需要更大的力” 这类基础规则时，人类不再需要向机器解释复杂的场景前提，只需要用自然语言下达目标指令，AI 就能自主判断执行路径。北大 5D 世界模型的技术突破、国产 GPU 对高端 AI 训练的支撑，更是进一步降低了这类技术的落地门槛，让物理世界的交互创新不再受限于供应链约束。

从产业端来看，数字化转型进入深水区后，传统交互模式已经成为生产力提升的核心瓶颈。

我国数字经济规模已经超过 GDP 的 40%，但过去的数字化本质是 “业务数据化”，需要大量人工把线下流程搬到线上，交互成本居高不下。

当 AI 成为核心生产要素后，产业需要的是 “数据业务化”：让智能系统自主理解场景、自主完成任务。具身智能进入工厂能替代重复性的体力劳动，科研智能体可以自主完成从文献调研到论文撰写的全流程，医疗智能体的心脏磁共振诊断精度已经媲美顶尖专家 —— 这些交互模式的创新，本质是把人类从 “交互中介” 的角色中解放出来，让人力投入到更具创造性的工作中。英矽智能把药物临床前研发周期压缩 70% 的实践已经证明，高效的人机协作能带来生产力的指数级提升，这也是全球企业都在加速布局智能体应用的核心动力。

从政策端来看，全球 AI 竞争已经从技术比拼转向体系化生态的竞争，交互是连接技术与场景的核心枢纽。

美国、欧洲、英国都在同步推进 “安全监管 + 基础设施 + 场景落地” 的三位一体政策：一方面通过安全审查机制管控交互风险，为技术商业化提供政策背书；另一方面投入重金建设 AI 可编程云实验室、开源科学 AI 模型等公共基础设施，降低交互创新的成本。

我国更是明确将具身智能关键基础设施作为政策抓手，统筹 “6 张网” 建设，目标就是在下一代人机交互的生态竞争中抢占先机 —— 谁先建立起成熟的物理世界交互标准和生态，谁就能在未来 10 年的全球 AI 产业分工中占据价值链上游。

（三）展望：人机共生时代的三个核心变革

当前的交互创新只是序幕，未来 3-5 年，人机交互将迎来第三次革命，整个社会的生产生活方式都会发生深刻变化。

第一个变化是交互范式将从 “指令式” 全面转向 “意图式”。

未来的人机交互不再需要人类学习机器的规则，而是 AI 主动理解人类的意图、预判潜在的需求。在工厂场景中，工人只需要说 “把这批货物按规格分类”，具身机器人就能自主识别货物、规划路径、完成分拣，不需要编写复杂的程序；在科研场景中，科研人员只需要提出 “寻找能在 200℃高温下保持稳定性的电池材料”，AI 科研平台就能自主设计实验、模拟验证、合成样品，大幅降低创新的门槛。腾讯混元提出的 Stem 稀疏注意力算法已经把大模型首字延迟降低 3.6 倍，这类技术的普及将让意图式交互的响应速度接近人类对话的水平，真正实现 “自然流畅” 的交互体验。

第二个变化是交互场景将从 “屏上” 全面延伸到 “物理空间”。

过去的人机交互主要发生在手机、电脑的屏幕里，未来交互将无处不在：家庭里的服务机器人能自主理解环境变化，商场里的导览机器人能主动识别用户需求，工厂里的工业机器人能与工人无缝协作。

国家发改委推动的具身智能 “三进”（进工厂、进商场、进家庭）政策，正是为这个场景爆发做准备。预计到 2030 年，物理世界的交互市场规模将是当前消费互联网交互市场的 5 倍以上，带动机器人、传感器、工业自动化等相关产业的全面升级，我国 AI 核心产业规模也将向 10 万亿元量级迈进。

第三个变化是交互治理将从 “事后监管” 转向 “全流程嵌入”。

随着交互深入到医疗、交通、科研等核心民生场景，交互的可靠性、公平性、安全性将成为技术落地的前提。

未来的 AI 系统将在设计阶段就嵌入安全评估机制，从模型训练到落地应用的每一个环节都有明确的责任划分。英国智库呼吁的 “员工参与 AI 决策的协商机制”、伯克利发布的双重用途风险评估框架，都是这类治理体系的探索。未来不会是 “AI 替代人”，而是 “人机协作” 的模式全面普及，交互过程中的人类自主权、数据隐私权、劳动权益都将得到制度层面的保障。

本期结语

人机交互的演变史，本质是人类不断拓展能力边界的历史：从最早的打孔卡到图形界面，再到如今的自然语言交互，每一次交互范式的革命都释放了巨大的生产力。

而当前我们正在经历的，是第一次让 AI 真正走进物理世界、走进生产核心、走进日常生活的变革，它带来的影响将远超之前的任何一次技术迭代。

这个过程中，我们不需要恐惧技术的进步，而是需要主动拥抱变化：对企业来说，要提前布局智能体在核心业务场景的应用，找到人机协作的最优模式；对个人来说，要学会从 “学习机器规则” 转向 “掌握与 AI 协作的能力”；对社会来说，要加快构建适配人机共生时代的治理规则和教育体系。

毕竟，技术的终极目标从来不是替代人，而是让人更像人，让人类有更多的精力去创造、去探索、去体验更有价值的人生。这也正是人机交互技术发展的终极意义。

报告说明

本文由作者搭建的AI智能工作流创作，再由作者人工轻度编辑完成。报告基于公开新闻资讯整理分析，仅供参考。