面向鸟群监测的视觉文本弱监督集群计数方法及装置

AITNT
正文
推荐专利
面向鸟群监测的视觉文本弱监督集群计数方法及装置
申请号:CN202510744038
申请日期:2025-06-05
公开号:CN120894798A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了一种面向鸟群监测的视觉文本弱监督集群计数方法及装置,包括:步骤1,设计有序数字序列嵌入文本提示模板,利用冻结文本编码器生成文本特征及分类器权重;输入鸟群图像至原始图像编码器获取多尺度视觉特征;步骤2,通过可学习特征适配器将视觉特征与分类器权重融合,生成增强视觉特征;步骤3,利用多尺度信息交互模块的交叉注意力机制融合增强视觉特征与文本特征,传递文本语义信息,生成多模态融合特征;步骤4,基于多模态排序损失训练模型,计算融合特征与文本特征的相似度矩阵,通过损失优化图像块与序列匹配并微调图像编码器,得到优化编码器;步骤5,推理阶段采用多阶段筛选策略:先用原始编码器去除背景图像块,再用优化编码器预测筛选后图像块的鸟群数量并累加。本发明有效提升了鸟群计数的准确性。
技术关键词
文本特征向量 图像编码器 前馈神经网络 视觉 文本编码器 计数方法 图像块 多尺度信息 融合特征 排序损失 多模态 交叉注意力机制 分类器 学习特征 适配器 双线性插值 集群 计数装置
系统为您推荐了相关专利信息
1
一种基于情绪识别的主动触发并与终端交互方法及系统
终端交互方法 多模态注意力 交互内容 多通道 负荷
2
基于视觉惯性与RTK松耦合的室内外无缝切换定位方法
误差状态 坐标系 室内外无缝切换 视觉 惯性系统
3
一种基于单目视觉的目标定位方法
高维特征向量 定位方法 标记 物体 识别码
4
重建引导的多模态大模型训练方法、装置、应用及设备
视觉特征 文本 样本 模型训练方法 多模态
5
基于3D机器视觉的电池片微缺陷自动识别系统
缺陷自动识别 电池片固定装置 图像拍摄单元 三维卷积神经网络模型 机械传动模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号