基于原型匹配的文本信息引导的自进化目标检测方法

正文

推荐专利

申请号：CN202510767136

申请日期：2025-06-10

公开号：CN120339595A

公开日期：2025-07-18

类型：发明专利

摘要

本发明提供了一种基于原型匹配的文本信息引导的自进化目标检测方法，提取图像与文本中的局部、目标信息，分别得到输入图像中的各类候选目标与输入文本中的目标、属性指代词信息，采用多模态大模型和跨模态引导注意力机制，分别进行视觉与文本特征向量的提取与跨模态信息关系交互计算，将两种模态的特征向量原型进行动态匹配，根据匹配结果综合选择最终的目标。本发明将原本预训练模型中知识作用于文本引导的目标检测任务当中，使模型在面对没有数据集中没有见过的目标时具有了自进化的能力，也解决了输入文本与图像中存在大量冗余信息，不利于目标检测的问题，使得关键的目标图像信息与目标相关的文本信息能够充分对齐匹配，实现高性能的目标检测。

技术关键词

原型文本编码器注意力机制跨模态图像编码器预训练模型文本特征向量可读存储介质多模态图片视觉自然语言处理器工具包对象阶段语义

系统为您推荐了相关专利信息

一种基于图像识别的神经肿瘤识别定位方法及系统

识别定位方法识别定位设备形态学特征图像肿瘤轮廓

事件预警方法、电子设备、存储介质及程序产品

对象检测图像语义理解事件预警方法异常事件文本编码器

一种面向视障用户的店铺描述定制生成方法

店铺生成方法 PageRank算法自然语言空间布局信息

多风格手写电子签名识别系统、方法及存储介质

风格前馈神经网络识别模型构建方法笔迹特征深度学习算法

一种基于多视线点扩散函数的三维波前层析重构方法

点扩散函数残差网络重构方法大气层湍流

基于原型匹配的文本信息引导的自进化目标检测方法

站点导航

APP 下载