BEYOND Expo 2026:AI 开始进入真实场景

5 月 27 日，BEYOND Expo 2026 在澳门开幕。今年大会主题是“AI：数实共生”。相比 2025 年“赋能亚洲，连接世界”，今年的讨论明显从“连接”转向“落地”：AI 如何离开屏幕和对话框，进入机器人、智能硬件、空间计算设备，以及普通人每天都会接触的终端。

今年大会汇聚近 800 家参展企业，既有大型科技公司，也首次引入 OPC 等更小型的创新主体。开幕式吸引了来自中国、韩国、东南亚、中东、巴西、欧盟等国家和地区的 1000 余位嘉宾，现场更像一个跨区域、跨产业的创新交流场。

过去一年，AI 产业的重心已经从模型能力本身，转向能力如何进入真实设备。新的问题是它如何接入传感器、理解环境，并在用户开会、交流、移动、工作时被自然调用。

这也是 BEYOND Expo 2026 把议题推向机器人、AI 眼镜和更多硬件终端的原因。BEYOND Expo 联合创始人贺建东提到，亚洲不仅拥有 AI 软件和模型创新能力，也具备先进制造、硬件创新和基础设施优势。从芯片、硬件到 Physical AI，AI 要真正进入物理世界，首先需要现实世界里的制造、交付和基础设施能力。

▍Physical AI 的现实门槛

开幕式上，Physical AI 成为最先被展开的议题之一。AI 要进入现实世界，首先要面对真实环境里的不确定性。

NVIDIA 机器人与边缘 AI 副总裁 Deepu Talla 表示，在 Physical AI 的技术框架里，数字 AI 做邮件总结、文本生成、代码辅助，即便输出只完成 90%、95% 甚至 99%，人仍然可以补上最后一步。但 Physical AI 的压力完全不同，系统一旦进入真实环境，错误就可能变成一次误判、一次失败操作，甚至一次不安全的机械动作。

机器人落地也意味着更长的技术链路。机器人大脑需要先完成训练，再进入仿真环境测试，最后部署到真实机器人本体中。仿真并不是附属环节，而是 Physical AI 扩展的前提。真实世界过于复杂，机器人数量又远远不够，直接在现实环境里试错，成本高、效率低，也难以规模化。

数据问题同样决定着 Physical AI 的进度。真实世界高度多样、不可预测，充满大量边缘场景，单靠真机数据很难覆盖所有情况。NVIDIA 把合成数据、世界模型、仿真训练和强化学习放进同一条链路，希望补齐 Physical AI 的数据缺口。

普渡机器人创始人兼 CEO 张涛则把这个判断进一步拉回商业化节奏。在他看来，机器人距离自己的 ChatGPT 时刻还没有真正到来。瓶颈不只是模型，也包括数据规模和产品形态。机器人至少需要数千万到上亿小时的真机数据，同时叠加合成数据、互联网数据和人类视频数据，形成自己的数据金字塔。

用户侧同样关键。ChatGPT 的爆发不只是因为模型足够强，更因为聊天界面让普通人几乎没有门槛地使用大模型。机器人如果想迎来类似时刻，也需要某种通用机器人产品真正进入大众市场，让用户像购买手机、家电一样，低心理负担地使用它。

未来的产品形态也不会只剩下人形机器人。专用机器人、人形机器人，以及类人型、半人型机器人会长期并存。清洁、配送等固定场景适合专用机器人，而更复杂、更开放的环境，则会继续推动人形机器人发展。AI 进入物理世界，从来不只是模型能力提升，还需要数据、仿真、传感器、制造体系、终端设备和用户场景共同成熟。

▍AI 眼镜为什么能留下来

相比机器人，AI 眼镜是另一条更轻量、也更接近日常场景的路径。BEYOND Expo 2026 上，AI 眼镜开始成为被集中讨论的终端形态之一。相比“机器人什么时候真正进入家庭”，行业更早开始面对的问题是：AI 能不能先通过一副眼镜，进入用户每天的交流、工作、出行和现实场景。

某种程度上，AI 眼镜更像是 Physical AI 进入消费市场前的一次过渡。它先连接人的视觉、听觉和现实环境，再逐渐把 AI 从屏幕里的工具，变成一个始终在线的现实助手。

5 月 28 日，科大讯飞在 BEYOND Expo 2026 发布 AI 眼镜，把“AI 进入物理世界”进一步落到了一副真正戴在脸上的终端设备里。但相比模型参数，AI 眼镜首先要解决的，仍然是一个更现实的问题：用户为什么愿意长期戴着它。

相比手机和耳机，眼镜距离人的视线和听觉更近，也更容易影响日常体验。重量、外观、舒适度，会比功能更早决定用户是否愿意持续使用。一副原本不戴眼镜的人，为什么愿意把一台设备长期戴到脸上，本身就是 AI 眼镜进入消费市场前必须跨过的门槛。

“眼镜智能化”和“智能眼镜”的区别也在这里。前者先承认它是一副眼镜，再把 AI 放进去；后者则容易先把它当成一台小型电子设备。科大讯飞提到“好看”和“好用”两个关键词，本质上也在回应这个问题：用户首先接受的，是一副能长期佩戴的眼镜，其次才是 AI 功能。

已关注

关注

重播分享赞

视频详情

这副 AI 眼镜重量约 40 克，并采用全贴合式方案，通过降低厚度和体积实现减重。用户未必会感知“全贴合”本身，但会感知镜腿是不是太厚、鼻梁会不会累、戴久了会不会想摘下来。相比参数竞争，AI 眼镜更早进入的是佩戴体验竞争。

视力矫正同样决定 AI 眼镜能否进入更大的日常场景。对于近视、散光、老花用户来说，眼镜本来就是每天必须佩戴的物品。如果 AI 眼镜能够完成度数适配、瞳距匹配和镜片加工，它就更接近一副真正的日常眼镜。

今天的手机已经能完成翻译、拍照、录音，也能自动整理会议纪要。但 AI 眼镜真正需要证明的是当能力被放到脸上之后，能不能让用户少掏一次手机，少从现场抽离一次。

会展是一个非常典型的场景。人在这里不断切换注意力：听论坛、看展台、交换信息、处理跨语言交流。手机当然也能帮忙，但每次都需要用户先退出现场：掏出设备、打开应用、盯着屏幕，再重新回到对话里。这个动作看起来很小，但在高频交流场景里，会不断打断现场节奏。

AI 眼镜的机会，就在于它离用户的感知更近。如果翻译、记录、识别、提醒这些功能，可以在交流持续发生时完成，而不是让用户退回屏幕，它才有机会变成一个更高频的终端。

相比手机和耳机，眼镜还有一个天然优势：它能看到用户正在看的东西。展台、路牌、演示屏、对话对象，本来就处于用户视线里。

除了科大讯飞，千问 AI 眼镜也在 BEYOND Expo 2026 亮相。它走的是另一条路径：把阿里生态里的服务能力接到眼镜端。第一人称视角拍摄、AI 同声传译、空间 3D 显示，解决的仍然是眼镜能不能看见、听见和提示；打车、支付、商旅、演出娱乐查询，则进一步把问题推向服务调用。

现场体验中，用户已经可以直接通过语音完成信息查询和生活服务操作。对于这类产品来说，接入大模型只是第一步，更难的是，眼镜能不能在合适的时间理解用户需要什么，再把背后的服务能力调出来。

▍行业开始拼落地阶段

回顾过去一年，AI 眼镜发布得越来越密集。但从这场论坛讨论里能看到，行业真正开始竞争的是整个产业链协同能力。

一副 AI 眼镜背后，连接的是光学、镜片、材料、重量控制、声学、系统集成、零售渠道和视力矫正。它既是消费电子产品，也是一副真正需要长期佩戴的眼镜。

相比“智能眼镜”这种偏消费电子的定义，行业更倾向于先解决眼镜本身的问题，再把 AI 能力放进去。因为用户真正感知到的是镜腿会不会太厚、鼻梁会不会压、戴久了会不会想摘下来。

而 AI 能力真正开始产生价值的地方，则是现实场景。论坛现场被反复提到的，是会展、跨语言交流、商务活动、旅行和办公。这些环境都有一个共同特点：用户的信息输入非常密集，但手机又会不断打断现场交流。

AI 眼镜真正的机会，也正在于减少这种切换成本。如果翻译、记录、识别和提醒，可以在交流持续发生时完成，而不是让用户不断低头切回手机，它才有机会成为新的高频终端。

光学和感知能力，也被认为是 AI 眼镜真正的底层入口。舜宇光学提到，人类大量信息通过视觉获取，AI 如果想理解现实环境，也需要通过光学感知获取足够多的信息。对 AI 来说，真正重要的是能否进一步理解空间、深度、材质，以及用户当前所处的场景。

这也是为什么，AI 眼镜会比语音耳机更复杂。耳机主要处理声音，而眼镜同时还要处理视觉信息。它既要听清用户周围发生了什么，也要知道用户正在关注什么。只有声音和视觉真正结合，翻译、提醒、记录和后续整理，才不会变成彼此孤立的功能。

而从产业角度来看，这轮 AI 眼镜也意味着传统眼镜行业和消费电子行业开始真正融合。传统眼镜门店负责验光、镜片加工和最终适配，消费电子行业则负责 AI、系统和硬件能力。AI 眼镜已经形成一场围绕“入口”的竞争。

✦ 精选服务 ✦

「新探计划」由有新 Newin 联合探奇资本发起，我们关注 AI 大浪潮中持续解决真实问题的创业团队，为优质项目匹配合适的创业资源，不限于融资、宣传、产品设计以及商业化探索等。

✦ 精选内容 ✦

VITURE Beast 发布！姜公略谈 Vibe Coding、移动办公和 XR 的下一个十年

黄仁勋：AI Infra 将建设十年，Agent 才刚刚开始进入生产系统

对话 MIT 梁芊荟: Viba 想重新定义 AI 时代的种草逻辑

造数据、搭 RAG总超预算？北大这套开源Skills帮省80%成本

后键盘时代，SpeakON 们想要抢回被打字偷走的生产力