一种视频背景音乐生成方法、装置及存储介质

正文

推荐专利

申请号：CN202411918348

申请日期：2024-12-25

公开号：CN119383423B

公开日期：2025-04-25

类型：发明专利

摘要

本发明涉及一种视频背景音乐生成方法、装置及存储介质，涉及视频处理技术领域。本申请将待处理的视频分解为目标视频图像帧集和目标视频原声序列，并分别提取目标文本描述序列和目标字幕序列；通过条件特征提取模块从目标视频图像帧集、目标视频原声序列、目标文本描述序列和目标字幕序列中分别提取时序的目标视频图像帧条件特征、目标视频原声条件特征、目标文本描述条件特征和目标字幕条件特征；通过背景音乐条件配置器将各条件特征处理成目标条件特征；预训练的音乐生成扩散模型将目标条件特征引入到各反向过程的潜空间特征中以生成背景音乐。

技术关键词

视频背景音乐生成方法字幕编码器文本注意力图像特征提取模块残差结构解码器语音存储计算机程序 bert模型处理单元存储单元序列方法可读存储介质

系统为您推荐了相关专利信息

一种车端控制模型的优化方法、装置、设备及介质

云端文本指令语音可读存储介质

一种多模态深度伪造检测方法及系统

多模态深度模态特征音频编码器表达式视频特征提取

异常行为识别方法、装置、电子设备及非易失性存储介质

语音识别方法语义特征声纹特征风险

用于核工程典型构件的网格快速生成方法

网格快速生成方法典型策略应力平滑算法

基于全局文本识别的图像模糊度检测方法及系统

文本行票据图片票据区域文本检测模型字符

一种视频背景音乐生成方法、装置及存储介质

站点导航

APP 下载