摘要
本发明公开了一种基于大模型的空中时敏目标识别方法,属于图像处理与识别领域;具体为:对同一型号的飞机在不同时间点的飞行轨迹进行采集,获取包含空中时敏目标的图像数据和文本数据;然后,对图像进行预处理,利用CLIP模型将图像转换为视觉特征向量,获取编码后的图像特征。接着,对文本进行预处理,得到自然语言描述;并设计定义规则,将自然语言描述划分为多类型语义,进而通过设计语义提示合并器实施有机融合,输入到CLIP模型得到全局语义提示特征。最后,将每帧图像的全局语义提示特征作为查询向量,编码后的图像特征作为键和值向量,通过增强图像特征,最终有效识别出时敏目标。本发明提升了获取了具备强描述性和分辨性的目标。
技术关键词
语义
识别方法
文本编码器
自然语言
视频
图像编码器
视觉
飞机
定义规则
列表
数据嵌入
轨迹
图像数据集合
合并器
序列
模态特征
系统为您推荐了相关专利信息
物体三维重建方法
语义分割网络
参数化模板
超分辨率技术
非暂态计算机可读存储介质
文本生成模型
文本显示方法
电子设备
数据
应用程序编程接口
分类识别方法
分类识别模型
图像采集系统
模板
视觉