一种基于跨模态语义映射的图文视频生成方法及系统

AITNT
正文
推荐专利
一种基于跨模态语义映射的图文视频生成方法及系统
申请号:CN202510812784
申请日期:2025-06-18
公开号:CN120730138A
公开日期:2025-09-30
类型:发明专利
摘要
本发明提供一种基于跨模态语义映射的图文视频生成方法及系统,涉及数据处理技术领域,所述方法包括:步骤1,输入产品描述文本,执行层级语义解耦,提取核心对象名词、属性形容词及场景副词,构建分层级结构化语义树;步骤2,基于分层级结构化语义树,执行细粒度修饰语义的区域探索,识别属性形容词或场景副词的关联区域,为每个关联区域生成语义适配修正因子。本发明通过层级语义解耦、区域语义映射、跨模态特征融合及动态时空校准,实现产品描述文本到语义精准、时序连贯的动态视频自动化生成,确保视觉效果与文本语义一致。
技术关键词
语义 视频生成方法 跨模态 层级 关键帧 节点 图文 纹理 坐标 因子 风格 优化轮廓 动态 场景 注意力机制 标识 核心 材质特征 视觉
系统为您推荐了相关专利信息
1
一种由模型基于前后期CT影像评估胃癌治疗效果的方法
评估胃癌 影像提取模块 语义向量 特征提取模块 切片
2
一种基于视觉和AI智能体的道路基础设施异常识别方法
异常识别方法 交叉注意力机制 图像特征向量 道路异常识别 语义特征
3
一种基于深度学习的民族服饰图案语义分割方法及系统
民族服饰 语义分割方法 注意力机制 卷积神经网络提取 图案
4
一种基于大语言模型的文本序列推荐方法及系统
大语言模型 序列推荐方法 文本 阶段 模型预训练
5
信息检索方法和设备
信息检索方法 关键词 公网 资源 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号