研究 / 产品 / 应用 / 监管
今日核心信号
- 研究前沿正在从“更大模型”转向“更稳表示、更抗操纵、更懂物理世界”,基础范式创新重新成为焦点。
- 产品竞争加速贴近真实入口:支付、终端和系统级助手都在把 AI 变成可执行任务而不只是对话功能。
- 行业落地开始出现更硬的运营指标,港口、教育、医疗等场景都在给出效率、准确率和审批数量等可量化结果。
- 监管层面明显升温:前沿模型已被纳入跨境限制,欧美多层级规则同步推进,技术主权与属地治理并行加强。
前沿研究 / 论文
#1🔥重要
ConfSeq 把三维分子结构“写成语言”,药物筛选效率显著抬升
智源社区 6 月 14 日解读的 Nature Machine Intelligence 论文显示,中科院上海药物所团队提出分子构象描述语言 ConfSeq,把二面角、键角与伪手性编码进类似 SMILES 的序列框架,使 Transformer 能直接处理三维化学结构。实验中,0.75Å 阈值下构象预测 COV-P 从 47.9% 提升到 58.4%,生成分子的 PoseBusters 有效性达 82.3%,较现有最佳方法再增 6%,无条件三维分子生成采样速度约为扩散模型的 285 倍,并支持对 9800 万个 PubChem 分子做快速虚拟筛选。
#2🔥重要
FramingBench 指出 LLM 做商品排序仍易被“话术框架”带偏
OpenReview 于 6 月 14 日上线的研究《LLMs Struggle to Rank Products Robustly》把大模型推荐风险量化到更具体层面。作者构建覆盖 10 个消费领域的 FramingBench,评估 7 个模型在 19 种传播与广告影响技术下的排序稳定性。结果显示,只要不改变核心规格信息、仅调整叙事框架,就足以显著改变模型结论;最强干预方式可让指定商品在 76% 的情况下冲到第 1 名。这意味着面向消费者的“AI 导购”并不天然中立,平台未来必须强化检索治理、证据约束与抗操纵评测。
#3⚡值得关注
智源大会把“世界模型”再推到台前,Physis-v0.1 主打物理状态预测
被称为“AI 春晚”的智源大会在 6 月 14 日集中展示世界模型路线。按官方披露,悟界·Physis-v0.1 被定义为首个通用世界基座模型,强调从“预测下一个词元”转向“预测下一个物理状态”,可支撑 50 多个复杂物理场景的长程推理;同时还联动发布 RoboBrain Orca、Brainμ1.0、OpenComplex2.5 与面向科研和医疗的多类智能体。它值得关注的地方在于,国内前沿机构正把世界模型、具身智能和科研 Agent 放到同一技术栈里推进,试图补齐现有大模型在长期时序和物理规律理解上的短板。
产品与发布动态
#4🔥重要
苹果确认新版 Siri AI 暂不进入欧盟,AI 助手能力被监管博弈卡住
6 月 14 日消息显示,苹果决定不在欧盟推出新版 Siri AI 体验,涉及 iPhone、iPad 与 Apple Watch。新版 Siri 原本强调可读取屏幕上下文,并结合短信、邮件、照片等个人数据进行更深度的任务辅助,但苹果称欧盟对《数字市场法案》互操作性的解释会迫使其向第三方开放敏感数据接口,从而带来隐私风险;欧盟则回应这只是苹果的单方面选择,DMA 并不禁止其发布新产品。此事的意义在于,系统级 AI 助手已不再只是功能创新问题,而是直接进入平台规则、隐私边界与接口开放的硬碰硬阶段。
#5🔥重要
支付宝内测 AI 版“阿宝”,从菜单式入口转向一句话执行任务
《科创板日报》6 月 14 日披露,蚂蚁集团正在内测 AI 版支付宝,暂定中文名为“阿宝”。产品思路不是在原页面上加一个聊天框,而是重构为“服务找人”的原生 AI 交互:用户可通过文字或语音直接提出意图,一键进入 AI 界面,由系统调起叫车、点咖啡、点外卖等服务;在获得授权后,还可执行买基金、管理投资账户等理财任务。虽然上线时间未定、公司也未正式回应,但其看点非常明确:支付账户与生活服务、金融操作开始被统一封装进 Agent 工作流,超级 App 的下一轮竞争很可能围绕任务完成率展开。
#6⚡值得关注
HDC 2026:鸿蒙 7 把大屏从显示设备推向家庭 AI 中枢
华为开发者大会 HDC 2026 期间,鸿蒙 7 正式发布,智慧屏 MateTV 被重新定义为面向家庭场景的 Agent 终端。报道显示,其核心能力包括具备视觉感知与互动反馈的小艺智能体、鸿鹄 AI 计算画质、空间影像上屏,以及基于 UWB、星闪通信与指向算法的“灵犀交互”。更重要的是,华为把一次开发多端部署能力和教育、游戏、办公等原生适配生态捆到一起,试图把电视从“内容播放终端”升级成家庭娱乐、学习、办公和设备控制的入口。行业信号是,终端厂商正用系统与生态而非单点模型能力来定义 AI 硬件竞争。
行业应用落地
#7🔥重要
江苏龙潭港用 AI 重做场桥作业,一人可同时操控 5 到 6 台设备
江苏媒体 6 月 14 日报道,龙潭集装箱码头正把 AI 深度嵌入港口作业与调度。过去场桥司机需要在高空驾驶室内“一人一机”作业,如今通过远程控制中心、宽幅显示屏、操纵杆以及 TOS 全流程生产管理智能算法仓,操作模式已变成一人同时操控 5 到 6 台设备,劳动强度明显下降;在自动化模式下,场桥平均单机效率较传统模式提升 20% 以上,系统还可基于实时数据自动生成泊位最优排班方案。它说明 AI 在重资产基础设施中的价值,已经从单点自动化升级为跨设备、跨流程的协同优化。
#8⚡值得关注
科大讯飞教育模型进入高频批改场景,日均处理作业超 600 万页
围绕 2026 年高考与日常教学场景,科大讯飞披露其教育大模型已形成较大规模的常态化落地。基于星火 X2 与星火教育大模型,系统可完成手写作文批改、错因分析、个性化建议生成和班级学情画像。量化指标相对扎实:客观题智能批改准确率超过 99%,主观题整体准确率达 95%,产品日均批改作业超过 600 万页,已覆盖全国 3000 多所学校、服务 450 多万师生。与“AI 会不会做题”相比,这类应用更值得看,因为它把大模型真正接入教师减负、过程评价和教学决策的数据闭环。
#9⚡值得关注
北京持续推 AI+医药,三类 AI 医疗器械获批数量全国第一
科技日报 6 月 14 日披露,北京正滚动实施 3 个医药健康协同创新三年行动计划,把 AI 与医药、高端器械和监管科学联动推进。公开数据显示,2025 年北京上市创新药 6 款、创新医疗器械 10 款,AI 三类医疗器械获批 11 款,数量全国第一;布局方向覆盖脑机接口、手术机器人以及从研发、临床、注册到产业化的全链条体系。对行业而言,这条信息的重点不只在“数量领先”,更在于地方政府已开始把 AI 医疗落地和审批效率、生产试点、配套政策放在同一框架内推进,示范意义高于单点项目。
政策与监管
#10🔥重要
美国要求 Anthropic 屏蔽外籍人士访问顶级模型,前沿模型监管再升级
路透 6 月 14 日援引 Axios 报道称,特朗普政府已要求 Anthropic 屏蔽所有外籍人士对其最新模型的访问,不论相关人员身处美国境内还是境外。受此影响,Anthropic 已在全球范围暂停 Fable 5 与 Mythos 5 的服务,并安排高级技术人员前往华盛顿,准备与白宫官员会面寻求解决方案。虽然公开报道未完整披露触发细节,但事件已足够说明:前沿模型的可用性正在被纳入类似出口管制的国家安全框架,企业的全球发布、员工权限和客户服务边界都可能被政府指令即时改写。
#11⚡值得关注
欧盟开始评估 Anthropic 事件后果,技术主权再次被摆上桌面
同样在 6 月 14 日,路透报道称欧盟委员会正评估美国针对 Anthropic 的限制令对欧洲用户和市场带来的“实际影响”。欧盟发言人强调,任何应急措施都不应歧视欧洲合作伙伴,并借此再次提出欧洲需要强化“技术主权”。这一表态很关键:它说明欧美在先进 AI 模型的安全、开放和跨境供给上,并不存在完全一致的治理逻辑。对欧洲而言,事件不只是用户一时用不了某个模型,更是提醒其在算力、模型和平台层面对外依赖过高;对企业而言,则意味着今后跨境部署高端模型时,地缘与合规风险必须成为产品设计前提。
#12⚡值得关注
美国各州继续推进 AI 立法,联邦迟滞并未阻止属地监管加码
《华盛顿邮报》6 月 14 日指出,尽管特朗普政府半年前曾警告各州不要自行监管人工智能,但由于国会层面的统一规则迟迟难产,州政府正在加快补位。正在推进的议题包括聊天机器人与未成年人互动、雇主使用 AI 系统的边界,以及开发者在预防灾难性风险方面的责任义务。其意义在于,美国 AI 监管已不仅仅是“联邦是否立法”的问题,而是在现实中形成多层级、碎片化并行推进的局面。对平台和企业来说,未来面对的合规要求很可能不是一套全国统一规则,而是州与州之间不断分化的责任清单。
夜雨聆风