摘要
本发明公开了一种基于多模态特征融合网络的素描评语生成方法及系统,该方法包括:收集素描画作和评语;利用卷积注意力网络和卷积神经网络对编码后的图像进行特征提取;利用双向自注意力机制对编码后的素描画作评语进行特征提取;基于多模态特征融合的注意力网络对图像特征和文本特征进行特征融合;基于交叉注意力网络对图像特征和文本特征进行信息互补;构建解码器并进行训练;基于训练后的解码器生成素描画作评语。该系统包括数据集构建模块、图像特征提取模块、文本特征提取模块、特征融合模块、评语生成模块和解码器训练模块。通过使用本发明能够实现简易、客观、准确和快速的素描画作评语生成。本发明可广泛应用于人工智能技术领域。
技术关键词
多模态特征融合
卷积注意力网络
生成方法
融合特征
解码器
注意力机制
图像编码器
图像特征提取
特征提取模块
sigmoid函数
表达式
数据
矩阵
文本编码器