8月12日,成都人形机器人创新中心发布最新研发成果——中国首个机器人多模态模型RRMM(Raydiculous Robot Multimodal Model)及双臂协作系统RTACS(Raydiculous Two-Arm Cooperation System)。
什么是多模态模型(RRMM)?即,能使机器人理解推理抽象的语义指令,并调度双臂协作系统(RTACS)执行任务。目前仅OpenAI等国外头部企业发布类似成果,这标志成都人形机器人创新中心在我国多模态模型应用于人形机器人领域的率先突破,使“AI 物理化”进程加速,也让人形机器人从“预设摆拍”“遥控操作”进化到拥有更强的“大脑”和自主执行能力。
成都人形机器人创新中心相关负责人介绍,多模态(即多种异构模态)数据协同推理,能融合两种或两种以上不同感知来源,进行综合推理,并完成复杂任务,例如最新的ChatGPT4o展示其强大功能时,测试者不用传统的键盘输入问题指令,而是在一张纸上手写一个待解方程,以及手绘一个几何图形并用语音指令要求GPT4o解题,GPT4o通过图像识别、语音识别和语义理解及推理,快速给出准确答案,这就是典型的多模态应用。多模态应用于人形机器人领域,使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,这是人形机器人具有自主思考能力的关键核心技术。
区分和分拣圆柱体和长方体物体。
在成都人形机器人创新中心发布的相关资料中可以看到,语义指令有相对明确的将水果和非水果,饮料和非饮料进行区分和分拣,也有相对抽象的将圆柱体和长方体物体进行区分和分拣,还有比较抽象的把可食用和不可食用物品进行区分和分拣,完成以上任务需要机器人通过多模态模型自主对所有物品进行提取归纳,特别是对多个相似瓶子形状的物体,需进一步通过瓶身包装上的文字、图片等要素综合判断其是否为可食用,而非化妆品、洗涤剂等非食用瓶装物,才能最终完成任务。
区分和分拣水果和非水果。
据悉,成都人形机器人创新中心是目前国内唯一致力于研发“真正拥有大脑的人形机器人整机”的人形机器人新型研发机构,开创性推动中国人形机器人产业高质量发展。
评论前必须登录!
注册