摘要
本发明公开了一种多模态场景自适应提示的开放词汇目标检测方法及装置。该方法根据输入实例动态选择相应的场景提示,针对不同的训练类别自适应地学习这些场景提示,实现对类别知识的自适应迁移。通过在融合过程中结合位置和文本信息,可以动态学习视觉提示和区域提示,所获得的区域特征可以具有更强的可移动性,能够提高目标检测模型对未知类别的分类精确度。
技术关键词
多模态
场景
视觉特征
低秩分解方法
文本
多层感知器
存储计算机程序
模态特征
注意力
动态
输出特征
存储器
度函数
处理器
网络
矩阵
图像
关系
系统为您推荐了相关专利信息
脱敏策略
敏感数据识别
脱敏方法
场景
机器学习算法
舆情信息抽取
信息抽取模型
预训练模型
生成训练数据
实体
陪护机器人
自控系统
电磁干扰数据
分析模块
多模态
情感语音转换方法
频谱特征
声学特征
韵律特征
连续小波变换分析
多模态深度学习
交互方法
融合特征
多模态数据融合
深度学习模型