多模态场景自适应提示的开放词汇目标检测方法及装置

AITNT
正文
推荐专利
多模态场景自适应提示的开放词汇目标检测方法及装置
申请号:CN202410815968
申请日期:2024-06-24
公开号:CN118865379A
公开日期:2024-10-29
类型:发明专利
摘要
本发明公开了一种多模态场景自适应提示的开放词汇目标检测方法及装置。该方法根据输入实例动态选择相应的场景提示,针对不同的训练类别自适应地学习这些场景提示,实现对类别知识的自适应迁移。通过在融合过程中结合位置和文本信息,可以动态学习视觉提示和区域提示,所获得的区域特征可以具有更强的可移动性,能够提高目标检测模型对未知类别的分类精确度。
技术关键词
多模态 场景 视觉特征 低秩分解方法 文本 多层感知器 存储计算机程序 模态特征 注意力 动态 输出特征 存储器 度函数 处理器 网络 矩阵 图像 关系
系统为您推荐了相关专利信息
1
一种基于数据中台的敏感数据自动脱敏方法及装置
脱敏策略 敏感数据识别 脱敏方法 场景 机器学习算法
2
负面舆情信息抽取方法、装置、设备及介质
舆情信息抽取 信息抽取模型 预训练模型 生成训练数据 实体
3
失能老人全程陪护机器人及其自控系统
陪护机器人 自控系统 电磁干扰数据 分析模块 多模态
4
一种基于多特征建模和粒度感知的情感语音转换方法
情感语音转换方法 频谱特征 声学特征 韵律特征 连续小波变换分析
5
一种基于深度学习的多模态混合数据库储存和交互方法
多模态深度学习 交互方法 融合特征 多模态数据融合 深度学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号