摘要
本申请公开了一种音频语种转换方法、系统和相关装置,该方法包括:获取目标对象的初始音频流,确定所述初始音频流对应的初始音频特征、以及所述初始音频流对应的当前语种;基于所述初始音频特征和所述当前语种,获取当前转换轮次对应的目标特征片段;其中,不同转换轮次对应的所述目标特征片段基于所述初始音频特征的语义进行分割;确定至少一个转换语种,基于所述当前语种和所述目标特征片段,生成与所述转换语种匹配的转换音频。通过上述方式,本申请能够提高音频跨语种转换的准确性。
技术关键词
音频特征
智能分析模型
转换方法
对象
场景
语义分割模型
语音编码
文本
程序
处理器
指令
标识
可读存储介质
存储器
发音
电子设备
模块
系统为您推荐了相关专利信息
自然语言模型
深度学习模型
搭建模块
语义
误差函数
虚拟电厂优化调度方法
优化调度模型
燃气轮机
储能设备
风光