基于跨模态AI的国粹艺术基因解码方法及系统

正文

推荐专利

申请号：CN202511260311

申请日期：2025-09-04

公开号：CN120998160A

公开日期：2025-11-21

类型：发明专利

摘要

本发明提出一种基于跨模态AI的国粹艺术基因解码方法及系统，属于人工智能与数字媒体艺术交叉领域，包括：S1：构建国画‑音乐‑文本的多模态数据集；S2：将国画图像输入基于CLIP‑ViT改进的视觉编码器，经过归一化模块、位置编码模块和Transformer编码器，输出512维的视觉Token序列；S3：将视觉Token序列和情感标签输入跨模态适配器，采用自注意力机制将视觉Token直接映射至音乐隐空间，得到音乐嵌入向量；S4：将、用户参数输入改进的高频保真生成对抗网络中，生成符合五声音阶的中国传统音乐音频。本发明方法实现视觉艺术与听觉艺术之间的智能语义联通。

技术关键词

跨模态国画图像生成对抗网络归一化模块解码方法视觉文本注意力机制编码模块音乐特征数据音频适配器基因多模态编码器非暂态计算机可读存储介质序列

系统为您推荐了相关专利信息

一种事件相机辅助的多模态车载三维占用预测方法

激光雷达点云数据稠密点云事件相机语义标签查询建议

一种基于激光反射强度与视觉融合的车前地形类别识别方法

类别识别方法三维点云数据网络激光雷达视觉

一种基于生成对抗网络获取腐蚀管道表面形貌的方法

生成对抗网络模型样本表面粗糙度参数滑动窗口采样管道腐蚀评估技术

一种基于深度学习的商标图像检索方法及系统

商标图像检索方法语义向量实体链接技术知识图谱推理文本

一种家族企业治理协作管控系统

管控系统客户文件管理模块计算机可读指令风险评估报告

基于跨模态AI的国粹艺术基因解码方法及系统

站点导航

APP 下载