摘要
本申请公开了一种图像处理及模型训练方法、装置和设备,方法包括获取机器人视角的图像序列以及语言指令信息;语言指令信息用于表征图像处理任务的任务类型;确定图像序列中至少一帧图像分别对应的视觉令牌,以及语言指令信息对应的语言令牌;基于图像处理任务的任务类型,对语言令牌以及视觉令牌进行拼接处理,得到拼接后的令牌;对拼接后的令牌进行预测处理,得到预测令牌;对预测令牌进行图像处理任务。
技术关键词
令牌
轨迹
样本
视觉
图像处理模型
模型训练方法
序列
指令
噪声数据
规划
分辨率
机器人
图像处理装置
图像处理方法
标签
拼接单元
视角
计算机设备
系统为您推荐了相关专利信息
检索系统
电子病历数据
语义
多模态
三元组损失函数
探地雷达图像
图像识别方法
雷达图像数据
特征金字塔网络
检测头
云台控制方法
视觉设备
三角函数关系
激光测距仪
云台控制系统
工业生产线
动态调度系统
物联网传感器
机器人运动轨迹
任务分配算法