【原创】LET 2024主题探讨:人形机器人是否进入应用临界点?

2024-05-31 17:01

  小米人形机器人CyberOne上肢关节电机,是小米自研了一枚重量仅为500g,额定输出扭矩高达30N·m的高效电机,保证了上肢灵活性;髋关节主要电机瞬时峰值扭矩可达300N·m,配合自研的人形双足控制算法,行走姿态更加平稳。

  小米的人形机器人CyberOne更多的采用了以高性能、小型化电机为主的干系统,迎合了新能源时代下智能汽车从湿系统逐步替换成干系统的大趋势。从整机来讲,应用需要降低成本,这依赖核心硬件——零部件的成本的降低,同时还要提高其可靠性。

  所幸的是,关于硬件方面,我国在生产制造、迭代速度、成本等多方面都更具优势,基于全世界最高效、最庞大的供应链体系,人形机器人硬件制造是我国的强项。

  4月在京举办的人形机器人产业大会上,上百家企业携最新产品亮相,展示出产业链生态的优势,越来越多人形机器人产品涌现出来,必然将反向推动人形机器人核心零部件迎来一波迭代升级。

  2、软件

  人形机器人的制造,仅靠硬件的研发,远远不够,软件也必须跟进。不可否认,当前所推出的人形机器人,动作缓慢略显笨拙,或无面部表情,或有也显得僵硬,这是由于软件的发展仍处于初期,整体技术有待突破。

  软件技术包括复杂的运动建模和控制问题,有三条技术路线,一个是从机理出发,对整机进行运动学和动力学的建模,然后进行设计,进行规划控制;第二种是特斯拉展示的人的运动映射到机器人上面;第三个机理模型需要依赖模型的准确性,对于复杂环境的适应需要人的介入。

  第一种,通过强化学习生成各种动作,然后用它的基本步态,来融合形成环境的适应性,能够自动选择步态的组合;特斯拉应用的是第二种技术路线,亮点是神经网络完全端到端训练:输入视频,输出控制。

  这类似于特斯拉自动驾驶FSD V12开发中的神经网络训练 —— 处理所有输入信号,输出驾驶决策,直接复用其电动车成熟的视觉系统,FSD是特斯拉的自动驾驶解决方案,也是特斯拉人形机器人的“大脑”。

  小米人形机器人CyberOne搭载自研Mi-Sense深度视觉模组,做到对环境的全面理解,多模态结合的推理和交互,拥有完整的三维空间感知能力。

  目前,各种技术路线都有突破,但作业对象的适应性、环境的适应性还是非常的有限的。如何把机器人环境、任务融合起来发展,如何把技术路线打通,依然需要我们去探索。

  运动控制是非常重要的基础,首要的问题是人形机器人系统的不稳定,稳定控制很难,能够到一个真实的环境里面适应各种环境的扰动,保持稳定性以及作业的准确性,这都是它的难点。

  国家创新发展意见中要求,对软件的要求是突破仿生感知与认知、智能灵巧手、电子皮肤等核心技术,一些人形机器人的设计重点聚焦在与人类实现互动,拥有面部识别、语音合成和自然语言处理等功能,能够参与同人类的对话并理解人类情感。

  近日的一则消息令人鼓舞,中科大90后博士成功研发出人形情感交互机器人,拥有高度仿真的面部表情和触感,能够与人类进行自然的对话和互动。技术要点是通过部署30个电机驱动器,驱动柔性面部,结合人工智能算法去模拟真人的面部表情,呈现出真实自然的表情。

  毫无疑问,人工智能技术的发展可以帮助人形机器人更准确地理解人类语言,听懂人的指令,识别环境信息,并做出更合理的决策和行动。

  目前的人工智能正在迈向通用智能的路上,人工智能驱动的人形机器人极大地提高了通用性,克服了编程人形机器人的专属性,不是只能干一件事情,而是能够在多种场景中执行任务。

  就人工智能技术本身来说,我国与西方差距并不大,在算力芯片上稍有不足。近日传出阿里云去年推出的新一代HPN7.0架构,极有可能取代此前谷歌提出的Jupiter架构,成为下一代AI网络架构标准,作为AI基础设施关键底层技术,将大大有利于中国大模型发展及应用落地。

  这一消息,对人形机器人技术来说,有两点启示,一是为人形机器人利用人工智能技术提供了方便;二是在国际科技巨头们竞相角力中,中国企业能够占据了先机,必须占据先机。

  目前,真正把大模型部署到人形机器人上面,还是有很多的局限性。现在的大模型依然靠数据,有一定的泛化能力,还是需要优化,如何把大模型融合到机器人里面,实现真正能够作业的具身智能,还是需要研究探索。

  未来几年,人工智能将成为其发展驱动力,人工智能技术正在一日千里地迈向通用人工智能突破的关键节点,人形机器人也在以非常规的加速度发展,现在可以说,是人形机器人大模型AI技术突破临界点。


  人形机器人公司“加速进化”认为,构建壁垒的不在大脑、小脑、本体,而是操作系统和计算单元,未来的机器人一定要有自己的计算单元,即SoC芯片。另一方面是操作系统,机器人在未来肯定会有对应的系统和开发工具,这样其他开发者才能在上面搞二次开发。

  人形运控产品壁垒极高,求解涉及大量物理数学原理,运控算法复杂,自研构型稀缺,开发难,软件工程复杂度也很高,解耦难度大,挑战诸多。

  3、通用性

  这里还要谈到人形机器人的通用性问题。人形机器人更强调类人的形态,这种类人的形态使得它更加适应建设的环境,并且能够有更好的人机交互感受,进一步说就是在作业上有更强的通用性和适用性。

  人形机器人的通用性可以无缝替换人类所从事的一些工作,专用机器人有更强的负载、更精准的节拍,但无法直接实现无缝替换,也就是说在各种环境里面执行各种任务,这对它的智能性提出了更高的要求,所以说,通用性也是人形机器人发展的一个重要目标。

  为此,要聚焦通用机器人底层技术,不断攻克核心零部件 (执行、感知) 能力瓶颈,让机器人技术真正通用化、普及化。在人形机器人研发上,小米坚持开源开放,为超过116家科研院所、高校、机构提供全套的开源平台。人形机器人正在迈进通用机器人的关键时间点,期待国产人形机器人能够引领“具身智能”时代的到来。

  为了便于叙述,我们把人形机器人的技术分为硬件与软件,真实的情况是二者是融合的,通过小脑做出动作,通过大脑进行决策,实现复杂环境当中操作多种机器设备的通用性。

  技术突破的方式以应用来迁移,通过整机来带动整个生态的发展,包括部件、整机系统里的大脑、小脑以及我们要去支持这些研究开发研制的供应链和工具链。

10秒快速发布需求

让物流专家来找您