摘要
本发明公开了一种基于时频图和视觉语言模型的信号调制识别和定位方法,涉及信号处理与人工智能技术领域,该方法针对现有技术识别精度低、依赖人工标注、通用模型在信号场景泛化性差的问题,通过短时傅里叶变换生成时频图;利用微调后的YOLO模型自动生成信号目标的边界框坐标和类别标签;结合语言模型生成描述文本构建多模态训练对;采用联合图文匹配损失与坐标回归损失的策略微调视觉语言模型,最终实现对时频图中信号目标的智能化识别与精确定位。本发明适用于复杂电磁环境下的信号检测与频谱态势感知。
技术关键词
信号调制识别
坐标
短时傅里叶变换
视觉
多模态
定位方法
计算机终端设备
标签
联合损失函数
图文
自然语言
处理器
文本编码器
人工智能技术
计算机程序产品
依赖人工
定位系统
跨模态