摘要
本发明涉及计算机技术领域,公开了一种直播语音生成方法及其系统,包括:接收第一直播输入数据;第一直播输入数据包括文本数据和风格信息;获取文本数据对应的目标文本信息;对风格信息进行第一编码,得到目标风格特征,并对目标文本信息和目标风格特征进行第二编码,得到高维语音特征;根据风格信息对高维语音特征进行调整,得到与风格信息对应的目标语音特征,并根据目标语音特征生成目标语音。本发明通过由风格信息编码得到的目标风格特征与文本数据对应的目标文本信息进行编码,得到高维语音特征,进而根据风格信息再对高维语音特征进行调整,得到由目标语音特征生成的目标语音,使得通过文本内容生成的语音更为准确,更符合真实语音。
技术关键词
语音特征
语音生成方法
风格
文本
数据
分支
样本
人物动画
标签
上采样
编码模块
深度学习网络
标记
编码器
神经网络模型
信息编码
场景
系统为您推荐了相关专利信息
预测定位方法
配电网故障
故障预测模型
子模块
贡献率
机械运行参数
污水处理控制方法
浊度
神经网络模型构建
澄清池
龙眼
可溶性固形物含量
分级检测装置
分级检测方法
波长
识别模块
安全漏洞信息
静态代码分析
图谱
漏洞数据库