摘要
本发明公开了一种电力图像文本多模态理解方法、系统、设备及介质,包括:获取待理解的电力图像文本信息;将所述待理解的电力图像文本信息输入到训练后的电力图文大模型中,得到所述待理解的电力图像文本信息的理解结果,其中,所述电力图文大模型依次经电力图文样本、正负样本对以及混合样本进行训练,该方法、系统、设备及介质能够提高电力图像文本多模态理解的准确性。
技术关键词
电力
图文
图像文本信息
视觉特征提取
样本
语言模块
多模态
无监督
理解系统
数据
训练集
可读存储介质
处理器
采样模块
计算机设备
存储器
系统为您推荐了相关专利信息
变化识别方法
时序特征
特征提取网络
形态
图像识别模型
六氟化硫
流量控制模块
加热模块
数据采集模块
微型飞行时间质谱仪
车辆
样本
非瞬时性计算机可读存储介质
列表
场景