摘要
本发明提供了一种电力场景图像目标识别方法、多模态数据生成方法及系统,属于电力技术领域。本发明根据所述融合文本特征以及所述跨模态增强特征,得到与所述文本特征最接近的所述电力场景图像中的目标识别结果,对文本特征进行了融合处理,对图像特征进行了跨模态处理,实现了对图像特征的更高精度检测,在保证电力场景下的多模态数据完整性和全面性的前提下,能够生成更高精度的多模态数据。
技术关键词
可见光图像
文本
融合图像特征
数据生成方法
识别方法
跨模态
多模态
电力
图像增强
可读存储介质
电网场景
注意力
计算机程序产品
数据生成系统
采集设备
图像获取单元
数值
系统为您推荐了相关专利信息
医学知识图谱
大语言模型
实体
网页证据
检索策略
手势控制功能
鼠标设备
手部关键点检测
电子设备
手势识别功能