摘要
本申请提供一种图文质量评估方法、装置、电子设备和可读介质。方法包括:获取待评估图文数据,待评估图文数据中至少包含图像信息和文本信息;将思维链信息和待评估图文数据输入到预训练的多模态模型中,对待评估图文数据进行内容解释,得到图文补充信息,思维链信息包含第一引导信息;根据第一特征表示和第二特征表示进行特征融合,得到第三特征表示,第一特征表示基于图像信息得到,第二特征表示基于文本信息与图文补充信息的合并结果得到;根据第三特征表示进行质量打分,得到待评估图文数据的质量评估结果。该方法能够将图像特征与文字特征之间交互的价值纳入图文质量评估中,提高图文质量评估结果的准确性。
技术关键词
图文
打分器
融合策略
文本编码器
多模态
图像编码器
计算机程序产品
处理器
计算机设备
电子设备
可读存储介质
文字特征
变换器
指令
数据获取模块
系统为您推荐了相关专利信息
遥感影像变化检测
异构
融合策略
分类器
SAR遥感影像