一种AIGC多模态视听内容创作方法及系统

正文

推荐专利

申请号：CN202411806016

申请日期：2024-12-10

公开号：CN119299806B

公开日期：2025-02-28

类型：发明专利

摘要

本发明公开了一种AIGC多模态视听内容创作方法及系统，属于多模态视听内容生成与自动化创作的技术领域，包括输入模块，用户输入创作所需要的文本描述和素材；AIGC生成模块，将用户输入的文本描述和素材转换为视频序列及音乐片段；多模态融合与对齐模块，融合和对齐生成的视频序列和音乐片段，得到音视频；视频智能编辑模块，拼接音视频的片段，保持视觉上的连贯性和两个音视频之间的顺畅连接；输出模块，将生成的音视频输出为用户需要的媒体格式。本发明解决了现有技术中多模态视听内容创作存在的缺乏跨模态协同工作的能力，多模态信息融合和对齐时生成的内容在节奏、语义和情感上不一致，缺乏后期编辑过程的支持，内容衔接时不够自然，创作速度慢的问题。

技术关键词

创作方法音乐文本视听残差卷积神经网络多模态信息融合音视频转换器对齐模块序列视频帧同步卷积神经网络模型视觉特征提取关键词自然语言创作系统输入模块稳定视频

系统为您推荐了相关专利信息

一种海量电网运行数据的知识转换与融合处理方法及系统

电网运行数据统一数据模型语义事件知识库记录处理过程

针对目标场景的大模型预训练方法、装置、设备及介质

预训练方法场景多标签图像文本图像解码器

基于情感一致性蒸馏与信息瓶颈的多模态情感分析方法

语义向量情感分析方法信息瓶颈理论蒸馏情感特征

一种大模型生成指标的方法

应用程序编程接口指标结构化查询语言生成智能生成图表

自动化验证SOC sha单元的方法及装置

摘要仿真软件工具包脚本加密

一种AIGC多模态视听内容创作方法及系统

站点导航

APP 下载