摘要
本发明涉及机器人技术领域,尤其是涉及一种基于多模态多任务学习的机器人分类检测方法及系统,包括S1.构建多模态数据集并进行数据预处理;S2.将语义信息数据集和图像数据集进行对齐;S3.构建多模态目标检测模型,将多模态数据集输入模型进行多任务学习,对多模态数据集进行特征提取,并将提取后的视觉图像特征和语义信息特征进行特征融合,利用核心语义注意力机制计算机器人的视觉图像特征的加权和,通过优化加权和完成对模型进行训练。本发明提出了一种基于多模态多任务学习的机器人分类检测方法,融合机器人的图像与语义信息,提升检测时文本与图像的特征交互性,使检测模型具备更高的准确性与鲁棒性。
技术关键词
分类检测方法
语义注意力
多模态
机器人
多任务
数据
视觉图像信息
文本
图像编码器
核心
正则化参数
神经网络模型
可读存储介质
索引
信息编码器
更新模型参数
系统为您推荐了相关专利信息
机器人动力学模型
襟翼部件
人机协作机械臂
飞机
数字孪生模型
机器人手眼标定
模块单元
重构模块化机器人
靶标
视觉相机
巡检机器人
管状壳体
负压腔体
攀爬机器人技术
拉杆