一种基于多模态大模型的无人机巡检图像智能分拣方法

正文

推荐专利

申请号：CN202411689464

申请日期：2024-11-25

公开号：CN119600484A

公开日期：2025-03-11

类型：发明专利

摘要

本发明实施例提供一种基于多模态大模型的无人机巡检图像智能分拣方法，属于图像处理技术领域。所述分拣方法包括：通过无人机巡检采集设备状态数据，并进行预处理；从预处理后的图像数据中提取出能够反映电力设施状态的特征；基于从预处理后的图像数据中提取出的能够反映电力设施状态的特征，计算实现相似图像的高精度匹配；根据CLIP的图像编码器和文本编码器，将需要匹配的特征的跨模态图像数据和文本数据编码成特征向量形式，映射到同一特征空间，并计算图文余弦相似度，以实现跨模态匹配关联图文。该分拣方法可以智能分析用户数据需求意图，从海量图像数据库中检索相关联图像数据，达到以图搜图和以文识图的效果。

技术关键词

图像编码器文本编码器无人机巡检图像智能分拣方法 Siamese网络电力设施图文数据编码图像分割算法采集设备智能分析用户网络结构分布式存储技术跨模态图像

系统为您推荐了相关专利信息

基于元学习的预训练多模态模型特征均匀对齐方法

图像嵌入编码模块文本编码器图像编码器多模态

一种相似图像检索方法及装置

浮点数图像检索方法图像处理模块物体图像检索装置

模型训练、谷物图像识别方法、存储介质和电子设备

模型训练方法神经网络模型图像编码器图像识别方法标签

两阶段的产品设计生成方法、系统、设备及介质

多模态图像嵌入两阶段产品概念设计阶段数据

一种用于高保真虚拟试穿的双阶段潜在扩散系统

变形服装扩散系统交叉注意力机制多尺度特征融合图像解码单元

一种基于多模态大模型的无人机巡检图像智能分拣方法

站点导航

APP 下载