基于跨模态融合网络的美学作品评价方法、系统及产品

正文

推荐专利

申请号：CN202511006898

申请日期：2025-07-22

公开号：CN121010859A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于跨模态融合网络的美学作品评价方法、系统及产品，首先使用深度神经网络为待评价美学作品图像生成结构化文本描述，作为文本模态；然后将文本模态和待评价美学作品图像同时输入跨模态融合网络中，基于文本编码器将文本描述映射为语义嵌入向量，基于图像编码器将图像分块后映射为视觉特征向量；所述语义嵌入向量和语义嵌入向量，经过多头双向交叉注意力模块后输出融合特征向量；最后所述融合特征向量输入回归器中，输出评价结果。本发明通过跨模态融合显著提升了模型的可解释性与鲁棒性，及评估的准确性。

技术关键词

作品评价方法跨模态美学注意力文本编码器图像编码器计算机程序指令语义深度神经网络色彩分支线条视觉结构编码器关系分块评价系统

系统为您推荐了相关专利信息

基于注意力特征融合的非平行任意到任意语音转换方法

语音转换方法通道注意力机制声学特征声码器特征提取模块

基于行为序列分析的安全防御方法、系统及设备

序列时序多源异构数据局部结构特征节点

多模态图像融合与去模糊模型及其训练方法和使用方法

可见光图像拉普拉斯金字塔编码器注意力多模态

一种花生生长程度预测方法、系统、介质和设备

程度预测方法花生随机森林模型注意力机制高分辨率卫星

一种基于细粒度门控机制的安全检测模型构建方法及系统

网络流量信息检测模型构建方法交互性多层次门控制模块

基于跨模态融合网络的美学作品评价方法、系统及产品

站点导航

APP 下载