摘要
本发明公开了一种基于深度学习的多模态数据质量评估方法,包括获取数据库中被标记为对齐的第一模态记录数据和第二模态记录数据;对第一模态记录数据和第二模态记录数据分别进行语义特征提取以得到文本结构化数据语义编码特征张量和元数据描述语义编码特征向量;对文本结构化数据语义编码特征张量和元数据描述语义编码特征向量跨模态联合编码以得到结构化‑元数据跨模态质量评估联合编码特征张量;基于结构化‑元数据跨模态质量评估联合编码特征张量生成重构记录数据,计算重构记录数据的偏移特征;通过第一深度学习模型对偏移特征进行质量评估;本发明通过语义编码特征提取、细粒度哈希跨模态编码与双向重构偏移评估,提高数据质量评估的精准性。
技术关键词
融合特征
偏移特征
跨模态
编码向量
文本
数据
编码特征
掩码矩阵
感兴趣
语义特征提取
深度学习模型
周期
键值
重构
Sigmoid函数
哈希算法
多模态
系统为您推荐了相关专利信息
OCR识别模型
光学字符识别
生成规则
语义关键词
因子
风险智能评估
大语言模型
模式特征向量
置信度阈值
多轮语音交互
电力变压器
背景建模方法
多尺度特征融合
特征提取模块
融合特征