一种基于开放词汇检测昆虫害虫的视觉语言检测方法及设备

正文

推荐专利

申请号：CN202510980648

申请日期：2025-07-16

公开号：CN120808398A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及一种基于开放词汇检测昆虫害虫的视觉语言检测方法，包括：将待检测图像与待检测图像的文本描述作为输入，提取出视觉特征和文本特征；构建多模态特征融合模块，将视觉特征与文本特征映射到统一的语义空间，生成语言感知的视觉特征与图像感知的文本特征，使用对比学习机制将语言感知的视觉特征与图像感知的文本特征在统一的语义空间中对齐。本发明为有效的现实世界害虫检测而设计，解决了适应性害虫识别系统的关键需求；多模态特征融合模块有效地集成了视觉语言模态，通过增强特征表示显著提高了开放词汇昆虫害虫检测的性能；区域提示在开放词汇场景中展示了卓越的泛化能力，从而能够在不同的环境中更加健壮和灵活的害虫检测。

技术关键词

视觉特征多模态特征融合计算机程序指令文本特征向量图像块高维特征向量多头注意力机制 sigmoid函数元素矩阵对象语义文本编码器特征金字塔处理器

系统为您推荐了相关专利信息

无人机视觉识别方法及装置

细粒度分类拓扑特征区域特征分析多模态压缩特征向量

一种变电站设备运行检测方法和装置

变电站设备注意力机制时间段 GRU模型处理单元

电池故障数据生成方法、装置和介质

随机噪声位置编码信息序列生成对抗网络训练数据生成方法

高速铁路桥梁震后通行能力评估方法、介质及设备

高速铁路桥梁能力评估方法桥梁系统计算机程序指令高速铁路路基

一种基于多模态数据融合的课堂注意力检测方法及系统

多模态数据融合动态权重分配骨骼关键点教师视觉传感器

一种基于开放词汇检测昆虫害虫的视觉语言检测方法及设备

站点导航

APP 下载