摘要
一种用于扩散策略的基于注意力机制的视觉‑状态‑力觉的多模观察融合方法,属于机械臂智能操作技术领域。为了提供更丰富信息的观测特征,本发明将点云特征和状态特征进行堆叠操作后,使用多头注意力机制进行特征交互,得到点云特征和状态特征的融合特征;对力和扭矩信息数据输入到投影模块中,得到投影后的力和扭矩信息数据进行位置编码后,再输入到力和扭矩信息编码器中,得到力和扭矩特征;输入到多头交叉注意力机制中提取跨模态信息;将得到的跨模态信息和得到的点云特征和状态特征的融合特征进行简单拼接操作,得到视觉‑状态‑力觉的多模观察融合特征;将视觉‑状态‑力觉的多模观察融合特征输入到扩散策略网络中,得到机械臂最终要执行的动作序列。
技术关键词
融合特征
融合方法
交叉注意力机制
信息编码器
多头注意力机制
点云特征
视觉
策略
状态编码器
投影模块
跨模态
表达式
数据
滑动窗口
前馈神经网络
动作交互
噪声预测
系统为您推荐了相关专利信息
课程推荐系统
个性化推荐算法
学习管理系统
多通道卷积神经网络
深度学习模型
上采样
脑肿瘤分割方法
编码器
多模态脑肿瘤
积层
船用发动机燃油
系统状态监测方法
数字孪生
故障诊断模型
多头注意力机制
卷积模块
折叠模型
注意力
多层感知机
多尺度结构特征
超分辨率模型
融合特征
图像超分辨率方法
浅层特征提取
多头注意力机制