摘要
本发明实施例提供了一种模型训练方法、视频配乐方法、装置、设备及介质,涉及视频处理技术领域,本发明提供的模型训练方法中,基于影视音视频数据构建训练样本,影视音视频中的背景音乐是专业人员根据视频内容需要进行匹配的,其背景音乐和对应的视频内容具有较高的匹配度。本发明中,从影视音视频中提取出样本音视频片段,再从样本音视频片段中提取样本多模态数据和样本背景音乐数据,因此,该样本多模态数据和样本背景音乐数据也是相匹配的。本发明中,再基于该样本多模态数据和样本背景音乐数据对多模态模型进行训练,得到背景音乐匹配模型,因此,该背景音乐匹配模型也可以基于目标视频的主题信息、氛围信息、环境信息匹配出合适的背景音乐。
技术关键词
音视频
模型训练方法
视频配乐方法
多模态
样本
数据
模型训练装置
主题
点击率
通信接口
可读存储介质
文本
语音
存储器
计算机
匹配模块
处理器
电子设备