摘要
本申请公开了一种工业场景人形机器人多模态协同决策方法及装置,涉及机器人控制技术领域,方法包括:获取工业场景中人形机器人视觉摄像头的多帧监控图像、力触觉传感器数据及设备运行传感器数据;提取多帧监控图像、力触觉传感器数据及设备运行传感器数据的特征向量作为多模态特征向量;将多模态特征向量作为训练样本训练跨模态模型,使得跨模态模型学习视觉、力触觉与设备数据的关联关系;获取动态工业场景数据,进而提取特征向量并输入训练后的跨模态模型进而生成场景描述信息;根据场景描述信息输出操作决策指令进而控制人形机器人。本申请通过跨模态特征融合与动态知识推理,可提升人形机器人在复杂工业环境中的任务执行精度与环境适应性。
技术关键词
人形机器人
力触觉传感器
多模态协同
视觉特征提取
跨模态
关键帧
决策方法
图像
视觉摄像头
数据
生成场景
触觉纹理特征
工业设备
卷积神经网络结构
机器人控制技术
系统为您推荐了相关专利信息
数据检索方法
注意力
医学知识图谱
连续性
监控模块
跨模态学习
关系建模
特征提取模块
视觉特征
模块通信