基于跨模态融合网络的美学作品评价方法、系统及产品

AITNT
正文
推荐专利
基于跨模态融合网络的美学作品评价方法、系统及产品
申请号:CN202511006898
申请日期:2025-07-22
公开号:CN121010859A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于跨模态融合网络的美学作品评价方法、系统及产品,首先使用深度神经网络为待评价美学作品图像生成结构化文本描述,作为文本模态;然后将文本模态和待评价美学作品图像同时输入跨模态融合网络中,基于文本编码器将文本描述映射为语义嵌入向量,基于图像编码器将图像分块后映射为视觉特征向量;所述语义嵌入向量和语义嵌入向量,经过多头双向交叉注意力模块后输出融合特征向量;最后所述融合特征向量输入回归器中,输出评价结果。本发明通过跨模态融合显著提升了模型的可解释性与鲁棒性,及评估的准确性。
技术关键词
作品评价方法 跨模态 美学 注意力 文本编码器 图像编码器 计算机程序指令 语义 深度神经网络 色彩 分支 线条 视觉 结构编码器 关系 分块 评价系统
系统为您推荐了相关专利信息
1
基于注意力特征融合的非平行任意到任意语音转换方法
语音转换方法 通道注意力机制 声学特征 声码器 特征提取模块
2
基于行为序列分析的安全防御方法、系统及设备
序列 时序 多源异构数据 局部结构特征 节点
3
多模态图像融合与去模糊模型及其训练方法和使用方法
可见光图像 拉普拉斯金字塔 编码器 注意力 多模态
4
一种花生生长程度预测方法、系统、介质和设备
程度预测方法 花生 随机森林模型 注意力机制 高分辨率卫星
5
一种基于细粒度门控机制的安全检测模型构建方法及系统
网络流量信息 检测模型构建方法 交互性 多层次 门控制模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号