摘要
一种面向中国古代时序图像的视觉叙事生成方法,通过多模态协同与知识引导实现历史语境下的连贯创作。算法采用文化增强的CLIP‑ct模型进行多模态特征融合,在传统CLIP架构中扩展纹饰语义层,精准解码传统绘画特征、服饰纹样等视觉文化符号;构建KG‑Transformer混合生成架构,通过动态知识门控机制融合知识图谱;同时,设计文化冲突检测确保时代一致性,最后通过蒙特卡洛树搜索优化情节发展,确保情节的合理性与创意性。本发明为文化计算领域提供了可扩展的技术范式,可应用于文物数字化叙事、非遗技艺传承等场景,推动传统文化资源的智能化解码与创新性表达。
技术关键词
生成方法
蒙特卡洛树搜索
视觉特征
时序
文本
图像
融合知识图谱
多模态特征融合
节点特征
多模态协同
解码概率
矩阵
解码器
创意性
语义
样本
地点
系统为您推荐了相关专利信息
定位方法
红外热成像模块
Canny算法
保留图像边缘
气体泄漏检测
工控机
故障预测模型
轻量化模型结构
嵌入式传感器
长短期记忆网络
智能诊断方法
自然语言
中医智能诊断系统
对话策略
图谱