摘要
本公开涉及一种影视剧配音中的情绪识别方法及装置,其中,该方法包括:获取源语言的影视剧音频及目标语言的待配音文本;利用训练好的源语言对应的情绪识别模型,对影视剧音频进行处理,提取出目标情绪特征;其中,情绪识别模型基于音频预训练子模型及特征提取子模型,并采用标注的训练数据进行训练得到;特征提取子模型用于提取音频特征,音频预训练子模型用于对提取的音频特征进行特征编码,生成情绪特征;利用训练好的目标语言对应的语音生成模型,基于目标情绪特征,对待配音文本进行语音合成,生成影视剧音频对应的目标语言的配音。通过本公开,配音中保留了原有情绪,实现了跨语种的语音无缝转换,使得配音达到了“原汁原味”的效果。
技术关键词
情绪识别模型
影视剧
情绪特征
语音生成模型
音频特征
情绪识别方法
文本
情绪识别装置
融合特征
计算机程序产品
处理器
样本
数据
编码
指标
识别模块
可读存储介质
系统为您推荐了相关专利信息
音频编解码方法
音频特征
音频编解码设备
矩阵
数据
安抚方式
情绪特征
人脸图像信息
情绪识别方法
车载设备
导览系统
多模态
数据采集单元
处理单元
视频特征数据
震动马达
数字信号处理模块
驱动信号
音频特征数据
智能功率管理