一种视频背景音乐生成方法、装置及存储介质

AITNT
正文
推荐专利
一种视频背景音乐生成方法、装置及存储介质
申请号:CN202411918348
申请日期:2024-12-25
公开号:CN119383423B
公开日期:2025-04-25
类型:发明专利
摘要
本发明涉及一种视频背景音乐生成方法、装置及存储介质,涉及视频处理技术领域。本申请将待处理的视频分解为目标视频图像帧集和目标视频原声序列,并分别提取目标文本描述序列和目标字幕序列;通过条件特征提取模块从目标视频图像帧集、目标视频原声序列、目标文本描述序列和目标字幕序列中分别提取时序的目标视频图像帧条件特征、目标视频原声条件特征、目标文本描述条件特征和目标字幕条件特征;通过背景音乐条件配置器将各条件特征处理成目标条件特征;预训练的音乐生成扩散模型将目标条件特征引入到各反向过程的潜空间特征中以生成背景音乐。
技术关键词
视频背景音乐 生成方法 字幕 编码器 文本 注意力 图像 特征提取模块 残差结构 解码器 语音 存储计算机程序 bert模型 处理单元 存储单元 序列方法 可读存储介质
系统为您推荐了相关专利信息
1
一种车端控制模型的优化方法、装置、设备及介质
云端 文本 指令 语音 可读存储介质
2
一种多模态深度伪造检测方法及系统
多模态深度 模态特征 音频编码器 表达式 视频特征提取
3
异常行为识别方法、装置、电子设备及非易失性存储介质
语音 识别方法 语义特征 声纹特征 风险
4
用于核工程典型构件的网格快速生成方法
网格快速生成方法 典型 策略 应力 平滑算法
5
基于全局文本识别的图像模糊度检测方法及系统
文本行 票据图片 票据区域 文本检测模型 字符
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号