基于多模态融合与强化学习的复杂场景抓取方法及系统

正文

推荐专利

申请号：CN202510945231

申请日期：2025-07-09

公开号：CN120735016A

公开日期：2025-10-03

类型：发明专利

摘要

本发明属于机器人抓取技术领域，公开了一种基于多模态融合与强化学习的复杂场景抓取方法及系统，包括获取用户的语言指令和抓取场景RGB图像；基于语言指令和抓取场景RGB图像，获得文本特征、图像特征、位置特征和抓取特征进行特征；基于交叉注意力机制，对文本特征、图像特征、位置特征和抓取特征进行特征融合操作，获得交叉注意力特征；将交叉注意力特征作为状态空间，抓取位姿作为动作空间，将抓取序列规划问题建模为马尔科夫决策过程，采用强化学习方法进行求解，获得最终的复杂场景抓取模型。本发明通过多模态联合建模与预训练模型先验融合，不仅提升了机器人在面对复杂环境中的适应能力，还显著提高了方法的泛化性和现实世界中的执行效果。

技术关键词

高维特征向量抓取方法强化学习方法多模态交叉注意力机制图像位置特征场景文本机器人抓取技术指令引导机器人序列计算机处理器抓取系统特征提取模块抓取动作数据获取模块

系统为您推荐了相关专利信息

基于多分子模态融合的通用蛋白质-RNA结合预测方法

交叉注意力机制分子多层感知机神经网络模型序列

一种多语种训练管理系统及方法

训练管理系统个性化学习路径模块智能算法训练管理方法

基于深度学习的多模态传感器数据自适应对齐方法及系统

异构传感器对齐方法特征提取网络多路径多模态传感器

一种基于大数据信息化教学优化方法

知识点信息化教学动态知识图谱深度学习提取特征多头注意力机制

飞行人员操作状态分析方法

状态分析方法眼动轨迹 XGBoost模型动作捕捉传感器多层卷积神经网络

基于多模态融合与强化学习的复杂场景抓取方法及系统

站点导航

APP 下载