发展动态与趋势
一、国内动态
(一)概述
本周国内 AI 领域产业政策与技术突破双轮驱动,核心产业规模已突破 1.2 万亿元,相关企业超 6200 家。
国家发改委明确将出台 AI 落地配套文件,以具身智能关键基础设施为抓手统筹 “6 张网” 建设,推动机器人 “进工厂、进商场、进家庭” 场景落地。
第八届北京智源大会密集发布前沿成果:全球首个通用世界基座模型 “悟界・Physis-v0.1” 实现物理规律理解突破,支撑具身智能、工业仿真等场景;心脏磁共振辅助诊断智能体诊断精度媲美顶尖专家,科研智能体可自主完成文献调研到论文撰写全流程。腾讯会议上线 3 秒时延 AI 同传功能,支持音色模仿,大幅提升跨境协作效率。
(二)趋势洞察
国内 AI 发展已从技术孵化阶段进入生产力重构的关键期,“人工智能 +” 连续三年写入政府工作报告,标志着 AI 正式成为核心生产要素,未来将深度渗透企业核心业务环节。
政策端重点向具身智能、AI for Science 等硬科技方向倾斜,基础设施建设与场景落地同步推进,预计 3 年内企业运营模式将以智能体为核心完成全面重构。
技术路线上,世界模型、多模态融合成为核心突破方向,“懂物理” 的 AI 系统将打破数字与物理世界的交互壁垒,带动医疗、工业、科研等垂直场景的规模化落地。
同时产业生态呈现开源化特征,国产大模型凭借开源生态逐步参与全球竞争,“十五五” 期间核心产业规模有望向 10 万亿元量级增长。
二、国际动态
(一)概述
本周全球 AI 领域政策与产业协同推进,监管与创新并行。
美国特朗普政府签署 AI 行政令,要求前沿模型发布前 30 天提交政府评测,OpenAI、Anthropic 等头部企业已确认遵守该规则;NSF 联合 NVIDIA 投入 7500 万美元开发开源科学 AI 模型,同时宣布投资建设 AI 可编程云实验室网络,聚焦生物技术与材料科学领域的自动化科研。
英国政府投入 4000 万英镑新建 AI 研究实验室,重点解决大模型幻觉、短记忆等核心缺陷,同时 Google DeepMind 宣布 2026 年在英国落地首个自动化科学实验室,依托 Gemini 驱动材料科学研发。
欧盟发布《云与人工智能发展法案》等技术主权一揽子计划,计划 5-7 年将数据中心容量扩大 3 倍,构建自主可控 AI 技术体系。
产业端 OpenAI 秘密提交 IPO 申请估值超 8500 亿美元,苹果 WWDC 推出 AI 增强版 Siri,并为小型开发者免除 AI 云服务费用。
(二)趋势洞察
全球 AI 竞争已进入体系化比拼阶段,各国均围绕 “安全可控 + 科研赋能 + 产业落地” 三大方向构建竞争壁垒。
监管框架逐步清晰,美欧英均建立政府与企业协作的安全审查机制,在防范风险的同时通过政策背书加速技术商业化,预计将进一步推动头部 AI 企业的资本扩张。
AI 与科学研究的融合成为核心战略赛道,从云端实验室到自动化科研平台的投入持续加大,AI 驱动的科研范式将大幅缩短材料、生物等领域的创新周期。
人机交互向自然化、场景化升级,Siri 等消费级 AI 助手体验迭代,同时职场 AI 应用的权益保障受到关注,英国智库呼吁建立员工参与 AI 决策的协商机制,未来人机交互的伦理与公平性将成为技术落地的重要考量维度。
十大要闻精选
(一)【国内・产业】我国人工智能核心产业规模突破 1.2 万亿元,正式迈向智能化发展新阶段
概述:据手机搜狐网于 2026 年报道,我国人工智能核心产业规模已超过 1.2 万亿元,相关企业数量突破 6200 家,预计 “十五五” 末将增长至 10 万亿元以上。2026 年《政府工作报告》首次明确提出 “打造智能经济新形态”,标志着我国经济发展正式从数字化阶段迈向智能化阶段,AI 已从辅助工具转变为核心生产要素,深度进入企业核心业务环节。
短评:该数据直观展现了我国 AI 产业的爆发式增长态势,“打造智能经济新形态” 的政策定位明确了 AI 作为新质生产力核心支撑的战略地位。产业规模突破万亿元不仅是规模层面的里程碑,更意味着 AI 已从技术探索进入大规模产业落地的关键周期,将为千行百业的数字化转型、生产率提升注入核心动力,也为全球 AI 产业发展提供了 “中国路径” 的参考样本。
(二)【国内・政策】发改委谋划出台 AI 落地配套文件,全面推进具身智能领域高质量发展
概述:据今日头条于 5 月 22 日报道,国家发改委在 5 月份新闻发布会上表示,正在谋划出台加快人工智能落地的配套文件,进一步加大要素保障;将以具身智能关键基础设施建设为抓手,统筹 “6 张网” 建设,加快具身智能训练基础设施和应用中试基地建设,推动具身智能 “进工厂、进商场、进家庭”,全面推进具身智能领域高质量发展。
短评:具身智能是 AI 从数字世界向物理世界延伸的核心赛道,也是全球 AI 产业竞争的下一个战略制高点。发改委明确将具身智能基础设施作为建设重点,从底层算力、中试基地到场景落地形成了完整的政策支持链条,不仅将为国内具身智能产业发展扫清基础设施障碍,更有望推动我国在新一代 AI 技术落地应用上抢占全球领先地位,带动机器人、工业自动化等相关产业协同升级。
(三)【国内・技术】2026 北京智源大会发布全球首个通用世界基座模型 “悟界・Physis-v0.1”
概述:据新浪财经于 6 月 12 日报道,第八届北京智源大会开幕,会上发布全球首个通用世界基座模型悟界・Physis-v0.1,核心技术从 “预测下一个词” 升级为 “预测下一个物理状态”,可理解重力、碰撞、因果逻辑,处理全模态信息,支撑具身智能、工业仿真等真实场景应用。同时发布的还有多模态神经科学大模型、AI 驱动药物发现模型等多项突破性成果,多个技术指标超越国际主流工具。
短评:“悟界” 系列模型的发布标志着我国在世界模型这一 AI 前沿领域实现了从跟跑到领跑的跨越,解决了长期以来 AI “不懂物理世界规则” 的核心痛点,为 AI 落地实体场景提供了核心技术底座。这类底层技术突破不仅将大幅提升我国 AI 产业的核心竞争力,更将推动全球 AI 技术路线从纯语言模型向 “认知物理世界” 的方向升级,具有里程碑式的技术意义。
(四)【海外・政策】英国政府投入 4000 万英镑成立国家级 AI 研究实验室,攻关 AI 基础缺陷
概述:据GOV.UK于 3 月 4 日报道,英国政府将成立新的国家级 AI 研究实验室,投入 4000 万英镑支持蓝 sky AI 研究,为研究人员提供大规模计算资源,重点攻关当前 AI 模型存在的幻觉、记忆不足、不可预测等基础缺陷,相关研究成果将应用于医疗、交通、民生等领域,巩固英国在 AI 领域的全球竞争力。
短评:当前大模型的幻觉、可靠性不足等问题已成为 AI 规模化落地的核心瓶颈,英国成立国家级实验室聚焦基础缺陷攻关,是全球 AI 治理从 “应用监管” 向 “技术根源治理” 延伸的重要信号。这类公共部门主导的基础研究不仅能够降低企业的技术攻关成本,更有望推动 AI 技术从 “可用” 向 “可靠” 升级,为全球 AI 安全技术发展提供公共技术成果。
(五)【海外・产业】谷歌 DeepMind 将在英国建立首座自动化科学实验室,聚焦 AI 驱动材料研发
概述:据 Google DeepMind 报道,谷歌 DeepMind 将与英国政府深化合作,2026 年在英国建立首座自动化科学实验室,专注于材料科学研究。实验室将完全集成 Gemini 大模型,通过机器人每天合成和表征数百种新材料,大幅缩短 transformative 新材料的发现周期,相关成果将应用于能源、医疗、制造业等关键领域。
短评:自动化科学实验室是 AI 与科学研究深度融合的标志性产物,将彻底改变传统材料研发 “试错式” 的低效模式,实现新材料研发的指数级提速。DeepMind 此举不仅将推动 AI for Science 领域的商业化落地,更可能带动全球科研范式的变革,进一步巩固英国在 AI 驱动科学研究领域的全球领先地位。
(六)【海外・安全】美国 AI 安全研究所与 OpenAI、Anthropic 签署合作协议,共建前沿模型安全评估体系
概述:据 NIST 于 2024 年 8 月报道,美国 AI 安全研究所与 OpenAI、Anthropic 正式签署合作协议,双方将联合开展 AI 安全研究、测试与评估工作,针对高级 AI 系统的各类风险领域开展探索性研究,相关评估结果将为 AI 安全标准制定、监管政策完善提供技术支撑,同时研究所将为企业提供模型安全改进反馈。
短评:该协议是全球首个官方机构与头部 AI 企业建立的常态化安全合作机制,标志着 AI 安全治理从企业自愿承诺走向了 “政产学研” 协同的实质性落地阶段。这套评估体系的探索将为全球 AI 安全监管提供可复制的实践经验,也为平衡 AI 技术创新与风险防控提供了新的合作范式。
(七)【国内・应用】微软与英矽智能合作推动 AI 药物研发范式落地,临床前研发周期压缩 70%
概述:据微软报道,英矽智能与微软展开深度合作,将端到端生成式 AI 药物研发平台 Pharma.AI 部署在 Azure 云基础设施上,结合 Azure OpenAI 能力开发新一代智能代理。该平台将传统药物研发 4.5 年的临床前周期压缩至 12-18 个月,目前已推进 29 个临床前候选化合物,其中 12 个获得临床试验批件,验证了 AI 在药物研发领域的规模化应用潜力。
短评:AI 药物研发是 AI for Science 领域商业化进展最快的赛道之一,英矽智能的实践证明了 AI 可以系统性降低药物研发的时间成本和资金成本,为解决罕见病、疑难病药物研发的 “高投入、高风险、长周期” 痛点提供了可行路径。微软与英矽智能的合作也将加速这类技术的全球普及,推动生命科学研究进入 AI 驱动的新时代。
(八)【海外・科研】加州大学伯克利分校发布 AI 基础模型双重用途风险评估框架
概述:据 Research UC Berkeley 报道,伯克利分校研究团队发布《AI 基础模型双重用途风险评估与管理框架》,针对基础模型可能被恶意使用的风险提出了全流程评估与治理方案,帮助 AI 开发者提前识别、防控模型被用于网络攻击、虚假信息生成、有害内容制造等风险场景。
短评:随着大模型能力的快速提升,其双重用途风险已成为 AI 治理的核心盲区 —— 同一模型既可以用于生产创造,也可能被恶意用于危害公共安全。伯克利发布的这套框架填补了 “技术源头风险防控” 的空白,从模型开发阶段就嵌入安全治理逻辑,为全球 AI 企业、监管机构提供了可落地的风险管控工具,对推动 AI 技术负责任发展具有重要的前瞻价值。
(九)【国内・社会】世界经济论坛发布 AI 教育就绪框架,系统性指引教育体系适配 AI 时代
概述:据手机搜狐网于 6 月 9 日报道,世界经济论坛发布《2026 年未来学习变革洞察报告》,指出当前 AI 已深度渗透教学场景,超六成学生借助 AI 完成课业,但教育制度更新滞后于技术迭代,带来认知能力退化、学术诚信崩塌等四大风险。报告推出四维 AI 教育就绪框架,从基础保障、机构能力、教学实践、学习体验四个层面为各国构建适配 AI 时代的教育体系提供指引。
短评:AI 对教育的冲击是全社会层面的系统性挑战,零散的技术应用限制、教学工具升级已经无法适配 AI 时代的教育需求。该框架提出的系统性转型方案,不仅为教育领域应对 AI 挑战提供了完整的行动路线,更将推动教育体系从 “培养知识记忆者” 向 “培养 AI 时代的创新者” 转型,对人力资本的长期发展具有深远的战略意义。
(十)【国内・技术】北大 5D 世界模型 EvoPhys-World 登顶斯坦福榜单,全程使用国产 GPU 训练
概述:据网易新闻客户端于 6 月 13 日报道,北京大学研发的 5D 世界模型 EvoPhys-World 登顶斯坦福相关技术榜单,该模型全程使用摩尔线程 MTT S5000 国产 GPU 完成训练,打破了高端 AI 模型训练依赖进口 GPU 的刻板印象。同期腾讯混元提出的 Stem 稀疏注意力算法,将大模型首字延迟降低 3.6 倍,被国际顶会 ICML-26 收录。
短评:该成果不仅是 AI 算法层面的突破,更验证了国产 GPU 已经可以支撑世界模型这类高端 AI 任务的训练需求,为我国 AI 产业摆脱底层算力依赖提供了关键的实践验证。算法与硬件的协同突破,将大幅降低我国 AI 产业发展的供应链风险,也为中小国家发展自主可控的 AI 产业提供了 “低成本、高可用” 的技术路径参考。
本期洞察分析
AI 与人机交互:从数字对话到物理共生,交互范式正在迎来第三次革命
(一)现象观察:交互边界正在被全面打破
本周的 AI 行业动态透出一个清晰的信号:人机交互正在跳出 “人给指令、机器执行” 的传统框架,向更深更广的维度快速渗透。
整个产业正在同时发生三个维度的边界突破。
首先是认知边界的突破。
北京智源大会发布的全球首个通用世界基座模型 “悟界・Physis-v0.1” 首次实现了核心技术路线的转向:从过去大模型 “预测下一个词” 的语言逻辑,升级为 “预测下一个物理状态” 的物理逻辑,能够理解重力、碰撞、因果规律等现实世界的底层规则。
无独有偶,北京大学研发的 5D 世界模型 EvoPhys-World 登顶斯坦福相关技术榜单,且全程使用国产 GPU 训练。这类 “懂物理” 的 AI 系统首次让数字智能拥有了理解真实世界的能力,打破了长期以来横亘在数字空间与物理世界之间的交互壁垒。
其次是场景边界的突破。AI 交互已经从消费端的闲聊、搜索,快速渗透到生产力核心场景。
在工业端,国家发改委明确将统筹具身智能 “6 张网” 建设,推动机器人 “进工厂、进商场、进家庭”,2026 年我国 AI 核心产业规模已突破 1.2 万亿元,相关企业超 6200 家,AI 正式从辅助工具升级为核心生产要素。
在科研端,谷歌 DeepMind 宣布 2026 年在英国落地首个 Gemini 驱动的自动化科学实验室,每天可合成和表征数百种新材料;英矽智能的 AI 药物研发平台已经把传统 4.5 年的临床前研发周期压缩至 12-18 个月,29 个临床前候选化合物中有 12 个已获得临床试验批件,科研人员与 AI 的交互正在彻底改变 “试错式” 的传统科研范式。
在消费端,苹果 WWDC 推出 AI 增强版 Siri,腾讯会议上线 3 秒时延的 AI 同传功能且支持音色模仿,跨境交流、日常设备使用的交互门槛正在被快速拉平。
最后是治理边界的突破。
交互的深度普及也推动治理规则向前延伸:美国特朗普政府签署行政令要求前沿模型发布前 30 天提交政府评测,AI 安全研究所已与 OpenAI、Anthropic 建立常态化安全评估机制;英国投入 4000 万英镑成立国家级 AI 实验室,专门攻关大模型幻觉、短记忆等影响交互可靠性的基础缺陷;加州大学伯克利分校发布了全球首个 AI 基础模型双重用途风险评估框架,从技术源头防控交互风险。从技术研发到落地应用的全流程,交互的规则体系正在快速成型。
(二)原因剖析:三重需求共同推动范式变革
人机交互的快速迭代不是偶然的技术演进,而是技术成熟、产业需求、政策引导三重因素共同作用的必然结果。
从技术底层来看,多模态融合与世界模型的突破解决了交互的 “理解瓶颈”。
过去的人机交互本质是 “转译”:人类需要把需求转化为机器能理解的代码、指令、关键词,交互效率受限于人类对机器规则的熟悉程度。
而如今大模型的自然语言理解能力已经接近人类水平,世界模型的出现更让 AI 首次拥有了对物理世界的常识认知 —— 当 AI 懂得 “杯子掉落会碎”“推重物需要更大的力” 这类基础规则时,人类不再需要向机器解释复杂的场景前提,只需要用自然语言下达目标指令,AI 就能自主判断执行路径。北大 5D 世界模型的技术突破、国产 GPU 对高端 AI 训练的支撑,更是进一步降低了这类技术的落地门槛,让物理世界的交互创新不再受限于供应链约束。
从产业端来看,数字化转型进入深水区后,传统交互模式已经成为生产力提升的核心瓶颈。
我国数字经济规模已经超过 GDP 的 40%,但过去的数字化本质是 “业务数据化”,需要大量人工把线下流程搬到线上,交互成本居高不下。
当 AI 成为核心生产要素后,产业需要的是 “数据业务化”:让智能系统自主理解场景、自主完成任务。具身智能进入工厂能替代重复性的体力劳动,科研智能体可以自主完成从文献调研到论文撰写的全流程,医疗智能体的心脏磁共振诊断精度已经媲美顶尖专家 —— 这些交互模式的创新,本质是把人类从 “交互中介” 的角色中解放出来,让人力投入到更具创造性的工作中。英矽智能把药物临床前研发周期压缩 70% 的实践已经证明,高效的人机协作能带来生产力的指数级提升,这也是全球企业都在加速布局智能体应用的核心动力。
从政策端来看,全球 AI 竞争已经从技术比拼转向体系化生态的竞争,交互是连接技术与场景的核心枢纽。
美国、欧洲、英国都在同步推进 “安全监管 + 基础设施 + 场景落地” 的三位一体政策:一方面通过安全审查机制管控交互风险,为技术商业化提供政策背书;另一方面投入重金建设 AI 可编程云实验室、开源科学 AI 模型等公共基础设施,降低交互创新的成本。
我国更是明确将具身智能关键基础设施作为政策抓手,统筹 “6 张网” 建设,目标就是在下一代人机交互的生态竞争中抢占先机 —— 谁先建立起成熟的物理世界交互标准和生态,谁就能在未来 10 年的全球 AI 产业分工中占据价值链上游。
(三)展望:人机共生时代的三个核心变革
当前的交互创新只是序幕,未来 3-5 年,人机交互将迎来第三次革命,整个社会的生产生活方式都会发生深刻变化。
第一个变化是交互范式将从 “指令式” 全面转向 “意图式”。
未来的人机交互不再需要人类学习机器的规则,而是 AI 主动理解人类的意图、预判潜在的需求。在工厂场景中,工人只需要说 “把这批货物按规格分类”,具身机器人就能自主识别货物、规划路径、完成分拣,不需要编写复杂的程序;在科研场景中,科研人员只需要提出 “寻找能在 200℃高温下保持稳定性的电池材料”,AI 科研平台就能自主设计实验、模拟验证、合成样品,大幅降低创新的门槛。腾讯混元提出的 Stem 稀疏注意力算法已经把大模型首字延迟降低 3.6 倍,这类技术的普及将让意图式交互的响应速度接近人类对话的水平,真正实现 “自然流畅” 的交互体验。
第二个变化是交互场景将从 “屏上” 全面延伸到 “物理空间”。
过去的人机交互主要发生在手机、电脑的屏幕里,未来交互将无处不在:家庭里的服务机器人能自主理解环境变化,商场里的导览机器人能主动识别用户需求,工厂里的工业机器人能与工人无缝协作。
国家发改委推动的具身智能 “三进”(进工厂、进商场、进家庭)政策,正是为这个场景爆发做准备。预计到 2030 年,物理世界的交互市场规模将是当前消费互联网交互市场的 5 倍以上,带动机器人、传感器、工业自动化等相关产业的全面升级,我国 AI 核心产业规模也将向 10 万亿元量级迈进。
第三个变化是交互治理将从 “事后监管” 转向 “全流程嵌入”。
随着交互深入到医疗、交通、科研等核心民生场景,交互的可靠性、公平性、安全性将成为技术落地的前提。
未来的 AI 系统将在设计阶段就嵌入安全评估机制,从模型训练到落地应用的每一个环节都有明确的责任划分。英国智库呼吁的 “员工参与 AI 决策的协商机制”、伯克利发布的双重用途风险评估框架,都是这类治理体系的探索。未来不会是 “AI 替代人”,而是 “人机协作” 的模式全面普及,交互过程中的人类自主权、数据隐私权、劳动权益都将得到制度层面的保障。
本期结语
人机交互的演变史,本质是人类不断拓展能力边界的历史:从最早的打孔卡到图形界面,再到如今的自然语言交互,每一次交互范式的革命都释放了巨大的生产力。
而当前我们正在经历的,是第一次让 AI 真正走进物理世界、走进生产核心、走进日常生活的变革,它带来的影响将远超之前的任何一次技术迭代。
这个过程中,我们不需要恐惧技术的进步,而是需要主动拥抱变化:对企业来说,要提前布局智能体在核心业务场景的应用,找到人机协作的最优模式;对个人来说,要学会从 “学习机器规则” 转向 “掌握与 AI 协作的能力”;对社会来说,要加快构建适配人机共生时代的治理规则和教育体系。
毕竟,技术的终极目标从来不是替代人,而是让人更像人,让人类有更多的精力去创造、去探索、去体验更有价值的人生。这也正是人机交互技术发展的终极意义。
夜雨聆风