摘要
本发明公开了一种带有图像识别抄表模块,包括:通过构建结构‑语义分离编码的跨模态图像对齐编码器,实现可见光图像与红外图像在结构与语义两个维度上的统一特征表达;通过主判别器与辅助判别器对抗训练机制,提升编码器生成模态不可区分的统一特征表示能力;利用可见光图像生成显著区域掩膜并迁移至红外图像特征图中,以空间注意力机制强化关键区域的特征响应强度;通过位置引导卷积注意力与径向结构约束,分别对数字区域与指针角度进行解码;利用可见光识别模型生成红外图像伪标签,并以置信度门控与KL散度约束方式训练红外模型;将各模块部署至边缘设备。本发明可有效将可见光图像训练的表盘识别模型迁移至红外图像模态下。
技术关键词
可见光图像
抄表模块
红外图像特征
跨模态图像
生成红外图像
编码模块
编码器
指针
标签
校正模块
掩膜
注意力机制
多模态
多尺度感知
语义特征
解码模块