一种用于机器人作业的大模型特征融合哈希自注意力方法

正文

推荐专利

申请号：CN202411945629

申请日期：2024-12-27

公开号：CN119357647B

公开日期：2025-04-08

类型：发明专利

摘要

本发明公开了一种用于机器人作业的大模型特征融合哈希自注意力方法，获取目标操作环境下多种复杂操作任务的示教数据；采集操作场景中的多模态信息；构建基于大模型的视觉‑文字精炼及对齐模块，将多模态信息中的声音信号和视觉信号输入，得到最终提取的视觉特征和最终预测的文字特征；采用特征提取器将最终得到的视觉特征和文字特征转换为特征相同的维度，利用设计的哈希交互机器人技能学习模块进行特征交互并进行特征提取，预测相应的机器人的动作；基于示教数据和预设的损失函数对哈希交互机器人技能学习模块进行训练，用于根据实时的视觉和文字输入预测机器人的动作。提高机器人在复杂处理操作环境下的自主学习、技能泛化和精准控制能力。

技术关键词

文字特征视觉特征交互机器人注意力方法预测机器人机器人作业长短期记忆网络对齐模块示教数据场景特征模态特征注意力机制融合视觉关节特征提取器

系统为您推荐了相关专利信息

一种图像检测方法、装置及设备

图像检测方法图像检测设备子模块序列风险

基于云计算的安防监控大数据处理方法及系统

安防监控大数据处理方法视频监控数据异常事件联动应急系统大数据处理系统

一种机器人物料搬运方法、机器人和存储介质

物料搬运方法机器人图像纹理特征深度感知装置物料搬运作业

一种复合型创伤病历智能质控系统的构建方法

节点病历文本时序依赖关系风险

基于多模态表征和因果推理的外科手术评估方法及系统

局部视觉特征全局视觉特征多模态动作特征轨迹特征

一种用于机器人作业的大模型特征融合哈希自注意力方法

站点导航

APP 下载