

5 月 27 日,BEYOND Expo 2026 在澳门开幕。今年大会主题是“AI:数实共生”。相比 2025 年“赋能亚洲,连接世界”,今年的讨论明显从“连接”转向“落地”:AI 如何离开屏幕和对话框,进入机器人、智能硬件、空间计算设备,以及普通人每天都会接触的终端。

今年大会汇聚近 800 家参展企业,既有大型科技公司,也首次引入 OPC 等更小型的创新主体。开幕式吸引了来自中国、韩国、东南亚、中东、巴西、欧盟等国家和地区的 1000 余位嘉宾,现场更像一个跨区域、跨产业的创新交流场。
过去一年,AI 产业的重心已经从模型能力本身,转向能力如何进入真实设备。新的问题是它如何接入传感器、理解环境,并在用户开会、交流、移动、工作时被自然调用。
这也是 BEYOND Expo 2026 把议题推向机器人、AI 眼镜和更多硬件终端的原因。BEYOND Expo 联合创始人贺建东提到,亚洲不仅拥有 AI 软件和模型创新能力,也具备先进制造、硬件创新和基础设施优势。从芯片、硬件到 Physical AI,AI 要真正进入物理世界,首先需要现实世界里的制造、交付和基础设施能力。
▍Physical AI 的现实门槛
开幕式上,Physical AI 成为最先被展开的议题之一。AI 要进入现实世界,首先要面对真实环境里的不确定性。

NVIDIA 机器人与边缘 AI 副总裁 Deepu Talla 表示,在 Physical AI 的技术框架里,数字 AI 做邮件总结、文本生成、代码辅助,即便输出只完成 90%、95% 甚至 99%,人仍然可以补上最后一步。但 Physical AI 的压力完全不同,系统一旦进入真实环境,错误就可能变成一次误判、一次失败操作,甚至一次不安全的机械动作。
机器人落地也意味着更长的技术链路。机器人大脑需要先完成训练,再进入仿真环境测试,最后部署到真实机器人本体中。仿真并不是附属环节,而是 Physical AI 扩展的前提。真实世界过于复杂,机器人数量又远远不够,直接在现实环境里试错,成本高、效率低,也难以规模化。
数据问题同样决定着 Physical AI 的进度。真实世界高度多样、不可预测,充满大量边缘场景,单靠真机数据很难覆盖所有情况。NVIDIA 把合成数据、世界模型、仿真训练和强化学习放进同一条链路,希望补齐 Physical AI 的数据缺口。

普渡机器人创始人兼 CEO 张涛则把这个判断进一步拉回商业化节奏。在他看来,机器人距离自己的 ChatGPT 时刻还没有真正到来。瓶颈不只是模型,也包括数据规模和产品形态。机器人至少需要数千万到上亿小时的真机数据,同时叠加合成数据、互联网数据和人类视频数据,形成自己的数据金字塔。
用户侧同样关键。ChatGPT 的爆发不只是因为模型足够强,更因为聊天界面让普通人几乎没有门槛地使用大模型。机器人如果想迎来类似时刻,也需要某种通用机器人产品真正进入大众市场,让用户像购买手机、家电一样,低心理负担地使用它。
未来的产品形态也不会只剩下人形机器人。专用机器人、人形机器人,以及类人型、半人型机器人会长期并存。清洁、配送等固定场景适合专用机器人,而更复杂、更开放的环境,则会继续推动人形机器人发展。AI 进入物理世界,从来不只是模型能力提升,还需要数据、仿真、传感器、制造体系、终端设备和用户场景共同成熟。
▍AI 眼镜为什么能留下来
相比机器人,AI 眼镜是另一条更轻量、也更接近日常场景的路径。BEYOND Expo 2026 上,AI 眼镜开始成为被集中讨论的终端形态之一。相比“机器人什么时候真正进入家庭”,行业更早开始面对的问题是:AI 能不能先通过一副眼镜,进入用户每天的交流、工作、出行和现实场景。
某种程度上,AI 眼镜更像是 Physical AI 进入消费市场前的一次过渡。它先连接人的视觉、听觉和现实环境,再逐渐把 AI 从屏幕里的工具,变成一个始终在线的现实助手。

5 月 28 日,科大讯飞在 BEYOND Expo 2026 发布 AI 眼镜,把“AI 进入物理世界”进一步落到了一副真正戴在脸上的终端设备里。但相比模型参数,AI 眼镜首先要解决的,仍然是一个更现实的问题:用户为什么愿意长期戴着它。
相比手机和耳机,眼镜距离人的视线和听觉更近,也更容易影响日常体验。重量、外观、舒适度,会比功能更早决定用户是否愿意持续使用。一副原本不戴眼镜的人,为什么愿意把一台设备长期戴到脸上,本身就是 AI 眼镜进入消费市场前必须跨过的门槛。
“眼镜智能化”和“智能眼镜”的区别也在这里。前者先承认它是一副眼镜,再把 AI 放进去;后者则容易先把它当成一台小型电子设备。科大讯飞提到“好看”和“好用”两个关键词,本质上也在回应这个问题:用户首先接受的,是一副能长期佩戴的眼镜,其次才是 AI 功能。
这副 AI 眼镜重量约 40 克,并采用全贴合式方案,通过降低厚度和体积实现减重。用户未必会感知“全贴合”本身,但会感知镜腿是不是太厚、鼻梁会不会累、戴久了会不会想摘下来。相比参数竞争,AI 眼镜更早进入的是佩戴体验竞争。
视力矫正同样决定 AI 眼镜能否进入更大的日常场景。对于近视、散光、老花用户来说,眼镜本来就是每天必须佩戴的物品。如果 AI 眼镜能够完成度数适配、瞳距匹配和镜片加工,它就更接近一副真正的日常眼镜。

今天的手机已经能完成翻译、拍照、录音,也能自动整理会议纪要。但 AI 眼镜真正需要证明的是当能力被放到脸上之后,能不能让用户少掏一次手机,少从现场抽离一次。
会展是一个非常典型的场景。人在这里不断切换注意力:听论坛、看展台、交换信息、处理跨语言交流。手机当然也能帮忙,但每次都需要用户先退出现场:掏出设备、打开应用、盯着屏幕,再重新回到对话里。这个动作看起来很小,但在高频交流场景里,会不断打断现场节奏。
AI 眼镜的机会,就在于它离用户的感知更近。如果翻译、记录、识别、提醒这些功能,可以在交流持续发生时完成,而不是让用户退回屏幕,它才有机会变成一个更高频的终端。
相比手机和耳机,眼镜还有一个天然优势:它能看到用户正在看的东西。展台、路牌、演示屏、对话对象,本来就处于用户视线里。
除了科大讯飞,千问 AI 眼镜也在 BEYOND Expo 2026 亮相。它走的是另一条路径:把阿里生态里的服务能力接到眼镜端。第一人称视角拍摄、AI 同声传译、空间 3D 显示,解决的仍然是眼镜能不能看见、听见和提示;打车、支付、商旅、演出娱乐查询,则进一步把问题推向服务调用。

现场体验中,用户已经可以直接通过语音完成信息查询和生活服务操作。对于这类产品来说,接入大模型只是第一步,更难的是,眼镜能不能在合适的时间理解用户需要什么,再把背后的服务能力调出来。
▍行业开始拼落地阶段
回顾过去一年,AI 眼镜发布得越来越密集。但从这场论坛讨论里能看到,行业真正开始竞争的是整个产业链协同能力。

一副 AI 眼镜背后,连接的是光学、镜片、材料、重量控制、声学、系统集成、零售渠道和视力矫正。它既是消费电子产品,也是一副真正需要长期佩戴的眼镜。
相比“智能眼镜”这种偏消费电子的定义,行业更倾向于先解决眼镜本身的问题,再把 AI 能力放进去。因为用户真正感知到的是镜腿会不会太厚、鼻梁会不会压、戴久了会不会想摘下来。
而 AI 能力真正开始产生价值的地方,则是现实场景。论坛现场被反复提到的,是会展、跨语言交流、商务活动、旅行和办公。这些环境都有一个共同特点:用户的信息输入非常密集,但手机又会不断打断现场交流。
AI 眼镜真正的机会,也正在于减少这种切换成本。如果翻译、记录、识别和提醒,可以在交流持续发生时完成,而不是让用户不断低头切回手机,它才有机会成为新的高频终端。
光学和感知能力,也被认为是 AI 眼镜真正的底层入口。舜宇光学提到,人类大量信息通过视觉获取,AI 如果想理解现实环境,也需要通过光学感知获取足够多的信息。对 AI 来说,真正重要的是能否进一步理解空间、深度、材质,以及用户当前所处的场景。
这也是为什么,AI 眼镜会比语音耳机更复杂。耳机主要处理声音,而眼镜同时还要处理视觉信息。它既要听清用户周围发生了什么,也要知道用户正在关注什么。只有声音和视觉真正结合,翻译、提醒、记录和后续整理,才不会变成彼此孤立的功能。
而从产业角度来看,这轮 AI 眼镜也意味着传统眼镜行业和消费电子行业开始真正融合。传统眼镜门店负责验光、镜片加工和最终适配,消费电子行业则负责 AI、系统和硬件能力。AI 眼镜已经形成一场围绕“入口”的竞争。
✦ 精选服务 ✦
「新探计划」由有新 Newin 联合探奇资本发起,我们关注 AI 大浪潮中持续解决真实问题的创业团队,为优质项目匹配合适的创业资源,不限于融资、宣传、产品设计以及商业化探索等。

✦ 精选内容 ✦
VITURE Beast 发布!姜公略谈 Vibe Coding、移动办公和 XR 的下一个十年
黄仁勋:AI Infra 将建设十年,Agent 才刚刚开始进入生产系统
对话 MIT 梁芊荟: Viba 想重新定义 AI 时代的种草逻辑
造数据、搭 RAG总超预算?北大这套开源Skills帮省80%成本


夜雨聆风