摘要
本发明公开了一种基于多模态情感语义自适应融合的图像美学质量评价方法,该方法包括下述步骤:获取美学图像以及对应的评论文本;对美学图像提取不同层级的视觉特征,构建美学图像的多尺度特征序列;对评论文本提取字级、短语级、句子级的语义特征,构建文本的多尺度特征序列;基于多头注意力机制得到情感语义增强的视觉和文本美学特征,并融合得到不同尺度的融合特征,构建跨模态动态权重,基于尺度注意力机制将不同尺度的融合特征整合为美学表征;根据美学表征对美学图像的美学质量进行预测,输出美学评价预测结果。本发明能有效地动态利用跨模态情感语义信息,提升复杂场景下多模态交互的灵活性与准确性。
技术关键词
美学特征
语义特征
视觉特征
评价方法
情感特征
融合特征
门控循环单元
文本
多模态
多头注意力机制
图像
跨模态
情感分类器
全局平均池化
sigmoid函数
系统为您推荐了相关专利信息
带钢表面缺陷
图像视觉特征
序列特征
数据
带钢缺陷
安全帽佩戴识别
特征提取网络
图像检测模型
语义特征
支路
图形处理器并行计算
数据关联关系
识别预警方法
深度学习模型
高风险