摘要
本发明涉及生物检测技术领域,公开了一种水下生物检测方法、装置、设备、存储介质及程序产品,本发明利用大语言模型处理待检测水下生物类别名称得到类别描述,将名称、图片和描述一同输入目标多模态检测模型处理,减少了对人工标注的依赖,提高了数据处理的效率。同时,充分利用了文本和图像两种模态的数据信息,避免了单一模态数据的局限性,提高了检测的准确性。进一步,通过计算目标视觉特征与误检聚类中心的相似度,并根据相似度阈值进行结果判定,能够有效识别出可能导致误检的目标,进而能更好地平衡漏检率,避免了因误检处理措施不当而导致的检测性能下降,解决了正样本召回率降低的问题,提高了水下生物检测的可靠性。
技术关键词
水下生物检测方法
视觉特征
多模态
大语言模型
图片
文本编码器
生物检测装置
图文
融合特征
生物检测技术
可读存储介质
检测头
指令
计算机程序产品
模块
存储器
处理器
系统为您推荐了相关专利信息
数据融合方法
特征提取模型
多头注意力机制
模态传感器
融合策略
偏好特征
空调控制参数
空调控制方法
数据
特征提取模块