计算机:英伟达发布MIMICGEN机器人数据生成系统 加速构建具身智能数据飞轮
时间:2023-11-07 00:00:00来自:长江证券字号:T  T

事件描述

10月26日,英伟达与得克萨斯大学奥斯汀分校合作推出了MimicGen机器人数据生成系统,只需少量人类示范,便能自动生成大规模的机器人训练数据集。根据论文所述,仅需10个人类演示,MimicGen系统即可生成1000个合成示例;而通过200个人类演示,MimicGen能直接生成50000个训练数据,涉及18个任务及多个模拟环境。

事件评论

控制动作数据集稀缺是阻碍具身智能发展的核心瓶颈之一,MimicGen有望大幅度降低机器人数据集门槛。在当前条件下,让机器人在不同场景和物体上执行任务需要大量的数据集和人力投入,需要数万个演示数据才能实现机器人模型在某一场景的高泛化能力。泛化能力不足会导致机器人在实际任务环境中触发较高比例的“CornerCase”。MimicGen系统通过模仿学习生成高质量数据,可以生成需要不同操作技能的长期和高精度任务数据,如拾取放置、插入和与关节物体交互,可以大幅度降低机器人数据集门槛。

合成数据集助力具身智能从图像-文本模型(VLM)阶段向图像-文本-动作模型(VLA)阶段迈进。相比于VLM模型,VLA把机器人动作数据也作为一种模态融入大模型算法,因此可以用单个模型完成感知、决策、控制全流程计算。将动作数据作为模态融入后,机器人动作将成为思维链的一环,实现了端到端的解决方案,因此决策与控制的衔接更流畅,更具逻辑性。目前VLA方案的瓶颈在于机器人动作数据难以匹配其他两种模态的数据规模,所以三种模态的同步数据较为稀少,需要机器人动作数据的长期积累。

MimicGen系统加速构建具身智能数据飞轮。大规模、高质量的数据流是人形机器人软件系统持续保持领先的核心要素。类比智能驾驶,未来每一个具身智能机器人都可以成为一个数据采集点,给AI厂商提供源源不断的数据流,助力机器人算法开发速度从线性增长转变为指数型增长,形成训练与场景开发的飞轮效应。MimicGen系统有望加速构建人形机器人的数据飞轮过程,加快具身智能技术推进。

后续投资关注三条主线:1、人形机器人零部件相关标的:主要为减速器、滚珠丝杠、无框力矩电机等高价值量零部件标的。人形机器人零部件会随着爆款场景的出现迅速放量,推动零部件相关产业快速发展。2、智能驾驶相关标的:包含IMU、激光雷达、视觉摄像头、智能驾驶芯片等标的;参考特斯拉商业模式,特斯拉Optimus算法搭建在FSD智能驾驶系统上,传感器、计算芯片等部件很大程度上沿用了智能驾驶方案。人形机器人有望开辟传感器、智驾芯片相关标的后续增长空间。3、大模型算法、算力芯片标的:软件算法是人形机器人的核心价值环节,算法性能高低直接决定了人形机器人的能力范围。大模型的算力作为算法的底层支撑,可以加快算法的迭代速度以及云端推理的响应速度。

风险提示

1、人形机器人技术发展不及预期;

2、人形机器人产品需求不及预期。

  • 浏览记录
  • 我的关注
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
  • 涨幅
  • 跌幅
  • 振幅
  • 换手率
loading...
本站郑重声明:所载数据、文章仅供参考,使用前请核实,风险自负。
© 2008 北京济安金信科技有限公司 北京合富永道财经文化传媒有限公司
京ICP备12044478号 版权所有 复制必究
本站由 北京济安金信科技有限公司 提供技术支持