摘要
本申请公开了一种音频语种转换方法、系统和相关装置,该方法包括:获取目标对象的初始音频流,确定所述初始音频流对应的初始音频特征、以及所述初始音频流对应的当前语种;基于所述初始音频特征和所述当前语种,获取当前转换轮次对应的目标特征片段;其中,不同转换轮次对应的所述目标特征片段基于所述初始音频特征的语义进行分割;确定至少一个转换语种,基于所述当前语种和所述目标特征片段,生成与所述转换语种匹配的转换音频。通过上述方式,本申请能够提高音频跨语种转换的准确性。
技术关键词
智能分析模型
音频特征
转换方法
对象
文本
场景
语义分割模型
语音编码
发音
程序
处理器
指令
标识
可读存储介质
存储器
电子设备
模块
系统为您推荐了相关专利信息
影像
协作交互方法
协作信息
协作内容
特征点集合
生成对抗网络
转换方法
多尺度鉴别器
残差模块
光学图像转换系统
穿刺路径规划方法
三维模型
三角形面片
活检针
穿刺对象
视频检测方法
关键帧
视觉特征
多模态特征
情感特征
评价口语能力
指数
语音识别设备
短时傅里叶变换
麦克风