多模态场景自适应提示的开放词汇目标检测方法及装置

正文

推荐专利

申请号：CN202410815968

申请日期：2024-06-24

公开号：CN118865379A

公开日期：2024-10-29

类型：发明专利

摘要

本发明公开了一种多模态场景自适应提示的开放词汇目标检测方法及装置。该方法根据输入实例动态选择相应的场景提示，针对不同的训练类别自适应地学习这些场景提示，实现对类别知识的自适应迁移。通过在融合过程中结合位置和文本信息，可以动态学习视觉提示和区域提示，所获得的区域特征可以具有更强的可移动性，能够提高目标检测模型对未知类别的分类精确度。

技术关键词

多模态场景视觉特征低秩分解方法文本多层感知器存储计算机程序模态特征注意力动态输出特征存储器度函数处理器网络矩阵图像关系

系统为您推荐了相关专利信息

一种基于数据中台的敏感数据自动脱敏方法及装置

脱敏策略敏感数据识别脱敏方法场景机器学习算法

负面舆情信息抽取方法、装置、设备及介质

舆情信息抽取信息抽取模型预训练模型生成训练数据实体

失能老人全程陪护机器人及其自控系统

陪护机器人自控系统电磁干扰数据分析模块多模态

一种基于多特征建模和粒度感知的情感语音转换方法

情感语音转换方法频谱特征声学特征韵律特征连续小波变换分析

一种基于深度学习的多模态混合数据库储存和交互方法

多模态深度学习交互方法融合特征多模态数据融合深度学习模型

多模态场景自适应提示的开放词汇目标检测方法及装置

站点导航

APP 下载