一种工业场景人形机器人多模态协同决策方法及装置

正文

推荐专利

申请号：CN202510933650

申请日期：2025-07-08

公开号：CN120422253B

公开日期：2025-09-05

类型：发明专利

摘要

本申请公开了一种工业场景人形机器人多模态协同决策方法及装置，涉及机器人控制技术领域，方法包括：获取工业场景中人形机器人视觉摄像头的多帧监控图像、力触觉传感器数据及设备运行传感器数据；提取多帧监控图像、力触觉传感器数据及设备运行传感器数据的特征向量作为多模态特征向量；将多模态特征向量作为训练样本训练跨模态模型，使得跨模态模型学习视觉、力触觉与设备数据的关联关系；获取动态工业场景数据，进而提取特征向量并输入训练后的跨模态模型进而生成场景描述信息；根据场景描述信息输出操作决策指令进而控制人形机器人。本申请通过跨模态特征融合与动态知识推理，可提升人形机器人在复杂工业环境中的任务执行精度与环境适应性。

技术关键词

人形机器人力触觉传感器多模态协同视觉特征提取跨模态关键帧决策方法图像视觉摄像头数据生成场景触觉纹理特征工业设备卷积神经网络结构机器人控制技术

系统为您推荐了相关专利信息

基于音视频关联信息瓶颈的视频定位方法

视频定位方法查询特征跨模态文本音频特征

一种基于深度学习的多源数据检索方法及系统

数据检索方法注意力医学知识图谱连续性监控模块

融合细粒度兼容和多视图相关的时尚单品推荐方法及系统

协方差矩阵模态特征语义特征推荐方法动态

基于多模态学习的服装搭配智能推荐系统及其方法

跨模态学习关系建模特征提取模块视觉特征模块通信

一种大数据文本检索挖掘系统及方法

文本挖掘系统图谱层次聚类算法检索策略

一种工业场景人形机器人多模态协同决策方法及装置

站点导航

APP 下载