多模态大模型训练方法、机器人动作预测方法及处理装置

正文

推荐专利

申请号：CN202410948190

申请日期：2024-07-16

公开号：CN118504645B

公开日期：2024-11-08

类型：发明专利

摘要

本申请公开了一种多模态大模型训练方法、机器人动作预测方法及处理装置。在训练多模态大模型的时候，将第一事件相机的第一事件数据、第一RGB相机的第一图像数据及第一文字指令分别编码处理，提取出同一预设长度的第一事件帧特征向量、第一图像特征向量及文本特征向量，从而将第一事件数据、第一图像数据及第一文字指令映射到同一高维空间，为后续多模态融合提供基础，可支持多模态输入。在机器人动作预测的时候，由于结合事件相机和多模态大模型的优势，令机器人具备在复杂场景（高速运动，光照条件差）下更强的感知能力，同时利用大模型的强大背景知识，使得机器人可以具备更加灵活合理的决策能力。

技术关键词

模型训练方法编码模块动作预测方法图像特征向量机器人文本特征向量事件相机多模态图像编码长短期记忆网络注意力矩阵数据压缩指令样本格式

系统为您推荐了相关专利信息

一种基于隐式协作与多维度感知的集群机器人平台及系统

集群算法邻居信标系统机制硬件系统

车头结构和庭院机器人

车头结构输出轴套传动轴组件执行机构驱动组件

用于为自动化系统和/或辅助系统的运行提供地图数据的方法和系统

交通道路地图自动化系统辅助系统高精度车辆

一种分拣机器人及其分拣方法

分拣机器人称重组件智能摄像头输送平台电磁铁

吊索式喷涂机器人

竖直支架喷涂机器人同步带轮水平支架超声波探测器

多模态大模型训练方法、机器人动作预测方法及处理装置

站点导航

APP 下载