当 AI 硬件不再「硬」
2024 年初,Rabbit R1 和 AI Pin 先后发布,两款设备都顶着「AI 硬件」的光环登场,却在短短几个月内遭遇口碑崩塌。Rabbit R1 被发现不过是一个手机应用套壳,售价 199 美元的 AI Pin 连基本的时间显示都延迟数秒。一个最基本的逻辑被反复验证:没有 Agent,硬件只是一具空壳。
这不是 AI 硬件的第一次溃败,也不会是最后一次。但它让整个行业开始正视一个根本问题——在 AI 时代,硬件的护城河究竟在哪里?
奇朵创始人黄勇说了一句非常直接的话:「硬件本身根本不是壁垒,在我们深圳人看来根本不是问题。」 这句话刺耳,却戳中了 AI Native 硬件最核心的设计哲学。
范式逆转:从「硬件+AI」到「AI 硬件」
过去十年,硬件公司做 AI 产品的思路是:先有硬件,再加 AI 能力。 智能音箱是音箱加了语音助手,智能手表是手表加了健康算法。这套逻辑在功能机时代运转良好,因为硬件本身承载了主要价值,AI 只是增值功能。
但 Agent 改变了这一切。
当 AI 能够自主规划任务、调用工具、记忆上下文、跨应用操作时,AI 不再是硬件的功能插件——AI 本身成了价值核心,硬件变成了它的「感官」和「手脚」。这意味着设计顺序必须彻底颠倒:不是给硬件找一个 AI 用途,而是先定义一个 AI Agent,再为它打造适合的物理载体。
奇朵的思路就是这个范式逆转的典型案例。在做相机硬件之前,团队花了大量时间定义清楚:这个 Agent 要服务哪个场景?它的行为边界是什么?它的知识从哪里来?当这些 Agent 层的核心问题回答之后,相机形态才成为顺理成章的选择——一台能引导孩子走向真实世界、对真实事物提问的设备。硬件是 Agent 的躯体,Agent 才是那个「产品」。
这种思路正在向更多品类渗透。机器狗为什么比普通玩具更有生命力?不是因为它的关节灵活,而是因为它背后有一个能够理解孩子情绪、与孩子对话、共同探索世界的 Agent。换掉躯体,Agent 依然在;换掉 Agent,躯体就只是一堆塑料和金属。
壁垒不在硬件,在 Agent 的三层能力
既然 Agent 才是核心,那么 AI 硬件真正的壁垒就落在 Agent 的三层能力上。
第一层:场景定义与持续进化
一个 Agent 能否持续理解用户、记住用户偏好、在长期交互中进化,是区分「聪明工具」和「真正伙伴」的关键。Rabbit R1 的失败不是因为它用了大模型,而是因为它的 Agent 没有记忆、没有规划、无法真正代替用户操作——它更像一个增强版语音搜索,而非真正的智能体。
真正有壁垒的 Agent 需要建立持续学习闭环。Hermes Agent 这类开源项目的核心特性就是「自我进化」:每完成一次任务,Agent 会提炼出可复用的技能沉淀到技能库里,下次遇到类似场景就能自动调用。这种能力的积累,才是硬件厂商无法靠「堆参数」复制的护城河。
第二层:知识底座的可靠性
在儿童教育硬件领域,这个问题尤为尖锐。「如果直接把大模型基于互联网世界知识无过滤地推理给孩子,那是极度不负责任的。」 黄勇在访谈中指出了 AI 硬件最脆弱的环节:知识来源不可控。
通用大模型的知识来自互联网,天然存在错误信息、偏见内容、不适龄内容等问题。对儿童用户来说,这是不可接受的风险。奇朵的解法是与《十万个为什么》等权威 IP 合作,构建了一套「三审三校」的知识底座——通过 AI Agent 流程将出版物知识结构化、审校、向量化,再基于此进行 RAG 和强约束推理,确保回答的每一条信息都有据可查。
这不是简单的知识库拼接,而是一套完整的 Agent 知识治理体系。 它决定了 Agent 能否在一个受控范围内安全、可靠地运行。对于面向儿童、教育、医疗等敏感场景的 AI 硬件,知识底座的构建能力就是核心壁垒。
第三层:成本结构与商业模式设计
Token 成本是 AI 硬件商业化的隐形地雷。大模型的推理成本是动态的,而硬件的定价逻辑基于 BOM 表(物料清单),是刚性的。这两种逻辑天然矛盾。
黄勇分享的解法值得参考:与云厂商以 License 方式合作,将基础 AI 能力成本固化并纳入硬件 BOM 表,而将高级延伸技能作为订阅服务。基础能力标准化,高级能力订阅化。 这个结构让硬件的定价变得可预测,也让 Agent 的进化有了商业支撑。
换个角度说,这其实就是把 Agent 的能力分层运营:底层是可靠的、经过严格约束的基础能力,保证产品体验的下限;上层是持续进化的增值能力,构成用户付费的动机。能够设计出这套分层结构的团队,才真正掌握 AI 硬件的商业密码。
强云弱端:AI 硬件的最优架构
AI 硬件在架构上有一个重要趋势:「强云弱端」。顾名思义,复杂推理放在云端,设备端只保留感知和交互能力。
这个选择的背后有三重原因。端侧算力有限,手机 SoC 的 AI 算力在 2026 年虽然已有显著提升,但与云端 GPU 集群相比仍有两个数量级的差距,复杂任务必须上云。端侧模型能力不足,端侧运行的小模型在推理质量、工具调用、多模态理解上,与云端大模型仍有明显差距。成本考量,端侧跑大模型会快速消耗设备电量,影响用户体验,而云端可以灵活调度算力资源。
这意味着 AI 硬件的竞争,本质上不是在「端」上竞争,而是在「云端 Agent 能力」和「端云协作架构」上竞争。谁能设计出更高效的端云分工,谁的 Agent 响应更快、更准、更省成本,谁就拥有更强的产品力。
当然,「强云弱端」不等于放弃端侧智能化。多模态大模型(VLM)的成熟,让设备端可以承担一部分实时感知任务——物体识别、场景理解、语音交互等。端侧负责「看见」和「听见」,云端负责「思考」和「决策」,这是目前最合理的分工逻辑。
为什么深圳的硬件能力不再是壁垒
深圳华强北用几十年时间证明了:任何消费电子产品的硬件方案,都可以在 3-6 个月内被复制。蓝牙耳机、智能手表、平衡车莫不如此。
但 Agent 能力的复制完全不同。
Agent 涉及用户数据的长期积累、场景知识的深度构建、使用习惯的持续学习——这些都是时间的朋友,不是钱能买到的。一个 Agent 在特定场景下训练了两年,它的知识厚度和交互流畅度,是新进入者即使投入十倍资金也难以跨越的差距。
这和互联网产品的逻辑类似:社交产品的护城河不是聊天功能,而是关系链;搜索产品的壁垒不是爬虫技术,而是索引数据和用户行为模型。AI 硬件的护城河同样不是硬件形态,而是 Agent 与用户、与场景、与知识底座之间建立的深度连接。
黄勇说「硬件本身根本不是壁垒」,另一层含义是:硬件可以被抄走,Agent 抄不走。 这对 AI 硬件创业者是一个重要提醒:与其把资源堆在工业设计、供应链谈判上,不如把核心资源压在 Agent 能力建设上。那才是真正难以复制的东西。
Agent 能力分叉:未来 AI 硬件的格局
展望未来,AI 硬件的 Agent 能力会出现明显的分叉。
通用 Agent 平台 会走向类似智能手机操作系统的路线——一个 Agent 平台支持海量场景和第三方开发者,平台本身通过生态盈利。苹果的「Apple Intelligence」和 OpenAI 的 Agent 产品正在朝这个方向演进。这类产品的竞争焦点是 Agent 平台的基础能力和开放生态。
垂直场景 Agent 硬件 会在教育、医疗、家庭陪伴、专业工具等场景深耕,构建高密度的领域知识库和专属交互范式。奇朵就是典型——它的 Agent 不是通用的,而是专门为儿童认知发展场景深度定制的。这类产品的壁垒来自对场景的深度理解,而不是技术本身。
两条路径的竞争逻辑完全不同:通用平台靠规模效应和生态壁垒胜出,垂直硬件靠领域知识的深度积累胜出。对于创业团队来说,选择哪条路,决定了 Agent 能力建设的投入方向。
写在最后
Rabbit R1 的失败不是 AI 硬件的终章,而是整个行业从「概念期」进入「方法论期」的转折点。
当行业开始真正理解「AI Native 硬件」的含义——不是用 AI 装饰硬件,而是让 Agent 成为产品内核——一批真正有生命力的硬件形态才会涌现。机器狗、人形机器人、家庭 Agent 终端、下一代可穿戴设备……这些产品的竞争,本质上是 Agent 设计能力的竞争。
硬件可以复制,供应链可以迁移,但一个在真实用户场景中持续进化了两年、三年的 Agent,它的厚度和温度,是任何竞争对手在短期内无法复制的。
Agent 才是下一代硬件的灵魂。 当这个行业真正接受这个事实,AI 硬件的黄金时代才会真正开始。
夜雨聆风