摘要
本发明提供了基于视觉语言模型的无人机检测方法,所述检测方法具体为:获取若干个文本图像对样本,并构建对应的标签向量;分别提取文本图像对样本的初始文本特征和初始图像特征,构建初始特征样本集;基于深度学习算法,构建文本描述子模型和图像理解子模型,并通过余弦相似度关联文本描述子模型和图像理解子模型,获取无人机检测模型;基于初始特征样本集对无人机检测模型进行训练;建立统一文本描述,结合无人机检测模型,输出待检测图像的无人机检测结果。本发明通过结合计算机视觉和自然语言处理进行文本和图像的联合建模,训练学习文本描述与图像特征之间的关联关系,在扩充训练样本多样性的基础下,实现对于无人机的高效准确检测。
技术关键词
无人机检测方法
文本
标签
深度学习算法
图像特征组合
扩充训练样本
矩阵
计算机视觉
生成方式
编码器
自然语言
元素
线性
爬虫
表达式
基础
系统为您推荐了相关专利信息
语音识别模型
意图
生成语音控制指令
自然语言理解
文本
数据搜索方法
实时数据
兴趣特征向量
多模态信息
图像视觉特征
特征提取模型
联邦学习方法
服务器更新
数据
参数
智能阅读推荐方法
考试场景
调节提示方法
文章生成方法
光照