这是来自于知乎的一篇文章《Cheng Chi: Robotics Beyond Algorithms》,是Sunday机器人公司的首席执行官兼联合创始人迟宬的一篇分享。
这篇文章解答了我最近在机器人研究过程中遇到的很多想不透的问题,因为当机器人想很好的落地,或者做机器人的公司想优先跑出,那对于软件、硬件、组织架构三者的能力上都要领先才可以。
原文地址:https://zhuanlan.zhihu.com/p/2020421242449048437?share_code=uXmH6lNtp8Lm&utm_psn=2027796334791469036
一个机器人公司想走通闭环过程,要从数据采集、到机器人模型算法开发,再到硬件的落地打通每一个环节。而当机器人需要批量化生产之后,对于硬件的设计研发、供应链管理、以及装配的一致性问题等都是对公司很大的考验。
在这个过程中可以通过软件来提升管理效率,解决一致性问题。但对于公司管理来说,要让员工感受到自身的价值和尊重,才能让公司更好的发展。而机器人学本质上是所有工程学科的交叉领域,具有跨领域知识储备和理解能力的人会更好的助力这个行业的发展。
以下是关于迟宬分享的总结:
迟宬本科就读于密歇根大学,师从Dmitry Berenson教授,本科毕业后他跟随Shuran Song教授攻读博士学位,最初在哥伦比亚大学,博士阶段后期随导师转到了斯坦福大学。博士期间主要做了两个研究工作,第一个是扩散策略(Diffusion Policy),第二个是UMI,相比于软件项目,UMI是个实打实的硬件项目,打造一个开源、轻量化的采集手套,不用机器人就可以完成数据采集。博士毕业后在X上认识了Tony,之后两人联合创立了Sunday机器人公司。

迟宬说,在本科和博士阶段他一度认为机器人算法就是机器人学的全部,但毕业后他才意识到,这些只是机器人学的冰山一角,硬件和数据才是让机器人系统真正落地的关键,也是区分不同研究成果、不同研发团队的核心因素。
关于硬件:硬件研发的核心环节与认知突破
以一个简单的硬件——相机为例,相机硬件的核心组件包括:镜头、传感器、图像信号处理器,每个组件都有对应的型号。当你确定了组件的型号,你的硬件的物料清单也就确定下来了。对于硬件端的采购,当你需要的量很小的时候你可以通过亚马逊这种零售渠道来采购,而且采购的时效性都很快。但是当你需要的量很大,或者需要修改任何零部件的设计时,零售渠道的缓存就会耗尽,这时需要让供应商或者更上游的厂家进行调整。
一个简单的相机的供应链的复杂程度能到达什么样呢?一个相机由镜头、印刷电路板和线缆组成,每个组件都有对应的供应商:镜头供应商需要采购镜片、镜身,印刷电路板供应商会根据设计文件采购传感器、电子元件并完成组装。
迟宬把这个叫成供应树,其实这个说法我还是第一次听说,还蛮新颖的。因为以往大家都以供应链还形容这个链条,当我们看到下面这个图,就可以理解什么是供应树了。

下面这个图更是展示了随着产品复杂度的提升,供应链管理的难度呈现指数级增长。一个复杂的硬件项目,仅采购环节就可能耗时数月,这也是供应链管理存在的必要性。供应链管理要提前告知对方新的零部件需求、采购量等信息,让各环节的生产计划同步推进,最终才能按时、按量拿到所需零部件。
供应链对硬件研发而言,其重要性不亚于甚至超过硬件设计本身,它直接决定了硬件研发中外购还是自研的决策。
所以之前大家在讨论制造整车的难度,其中有一点就是对于供应链的管理难度,何小鹏之前也吃过供应链管理的亏。

硬件准备好之后就要进行装配,装配工作最重要的是一致性问题,对于相机等传感器,需要保证不同批次产品的实测数据要保持一致。要解决一致性的问题,首先要对每件产品进行标识,然后进行校准和质量检测,检测到手指有问题,就需要退回到生产环节返工,或者是直接报废。
Sunday的创始软件工程师亨利就开发了一套软硬件结合的系统,能追踪生产过程中的所有数据。“这套软件系统落地后,我们能追踪到每只手套的每一个零部件、装配人员、装配时间、校准数据,甚至能将这些信息和后续采集的每一份数据相关联,这些信息还能同步到我们的训练数据加载器中。”
关于数采工作的思考:数据采集是一项运营工作,而运营的核心是人
Sunday机器人最初的数采工作负责人是Tony,招募了第一批20名数采专员,之后Camilla接手了数采工作,把团队从20人扩充到了200人。但因为是一对一的管理模式,所以最多只能到200人,一个人能管理的社交关系是有限的。所以,Perry成为了现任数采负责人,将数采团队从200人扩充到了现在的上千人。
迟宬说他因为是技术出身,所以最初以为可以通过写代码、用AI生成操作指引来提升数采效率,但现在发现,数据采集是一项运营工作,而运营的核心是人。
“如果能读懂人、建立良好的沟通和信任机制,哪怕没有复杂的软件系统,仅靠一个斯拉克沟通群和几张电子表格,就能支撑200人的数采团队高效工作。但如果没做好人的管理,工作人员感受不到自身的价值和尊重,也不清楚数采的具体要求和禁忌,那么再多的软件、再先进的技术,也无法弥补这一短板。”
机器人学的全栈认知与人才观
机器人学本质上是所有工程学科的交叉领域,拥有从硬件、软件、机器学习到数据采集的全栈视野和直觉,能帮助我们快速找到问题的解决方案,高效解决研发中的各类问题。
“这也是我们公司的人才招聘理念,我很幸运,如今Sunday机器人已有近70名员工。招聘时,我们最看重的是候选人跨领域的知识储备和理解能力。这些优秀的员工有一个共同点:拥有热情和好奇心。”
以上就是迟宬的分享,大家可以去知乎看看原文,还挺有启发的。
最近在看各种关于机器人模型相关的东西,科普文章、硬着头皮读论文、听博客看访谈、空的时候刷刷知乎,作为一个看硬件出身的人,最近看到Diffusion Policy,latent space这些词突然感觉不陌生了,可能这就是乔布斯说的connecting the dots吧。
突然想到了巴菲特很喜欢的一个纪录片《Turn every page》,Caro曾经说过:Turn every page, don't assume anything.
这是个学习笔记,记录研究过程中学习到的东西。
夜雨聆风