官方微信视频号
训练泛化的人形机器人规划、决策模型需要大量的标注数据,数据标注是机器人训练过程中的关键步骤,涉及对机器人所需的各种数据进行高质量、高精度的特征识别和标记,以提升大脑模型的泛化能力和人形机器人训练数据包括视觉、听觉、触觉等多种模态数据,数据标注类型包含图像标注、语音标注、3D点云标注和文本标注等多种类型,标注内容呈现出高度的专业性和复杂性。
当前的数据标注过程大多仍依赖于人工操作,存在工作效率低、难以拓展到多模态数据、难以适应复杂任务需求等问题,因此,研究一种多模态数据⾃动化标注解决方案具有重要理论和实际应用价值。
上海机器人产业技术研究院、复旦大学、上海交通大学、同济大学来数据集项目团队,根据人形机器人数据集数据标注相关标准,利用主动学习优化智能感知算法模型,研制了针对操作任务的多模态数据的自动化标注算法。
项目组将操作任务数据的自动化标注过程分为操作者与环境标注两个模块:
在自动化标注第一模块中,针对复杂的灵巧操作手部姿态估计和跟踪,项目组创新性地使用了空间基点集作为特征基,融合随机多视角的观测,进而通过点集注意力网络输出手部姿态控制点,并以逆运动学重定向到同构型双臂灵巧机器人,完成相应的操作任务。
在自动化标注第二模块中,项目组提出了一种可泛化的物体姿态估计方法,通过引入具有几何语义和特征语义的视觉表示,构建基于特征相关性的迭代排序-优化模块,实现在推理阶段对未知物体进行准确的6D姿态估计和跟踪。
目前相关研究成果已融合至自动化数据标注工具:CR-MAA(CR Multi-modal annotations CR多模态标注),能够有效提升数据标注效率和准确性、降低标注成本、优化标注流程和工作模式,通过主动学习技术优化得到的自动化标注算法模型也将为未来人形机器人数据集的拓展提供基础支持,促进人形机器人产业化进程。
机器人研究院联合复旦大学、上海交通大学、同济大学等高校已经发布了多模态数据质量评估与质量增强解决方案、多模态人形机器人数据标注智能感知技术解决方案,并对数据架构与格式、标注、治理与评价等数据集构建的关键环节开展标准化研究,为人形机器人大脑的打造赋能。