直播语音生成方法及其系统

正文

推荐专利

直播语音生成方法及其系统

申请号：CN202410981009

申请日期：2024-07-22

公开号：CN119052515A

公开日期：2024-11-29

类型：发明专利

摘要

本发明涉及计算机技术领域，公开了一种直播语音生成方法及其系统，包括：接收第一直播输入数据；第一直播输入数据包括文本数据和风格信息；获取文本数据对应的目标文本信息；对风格信息进行第一编码，得到目标风格特征，并对目标文本信息和目标风格特征进行第二编码，得到高维语音特征；根据风格信息对高维语音特征进行调整，得到与风格信息对应的目标语音特征，并根据目标语音特征生成目标语音。本发明通过由风格信息编码得到的目标风格特征与文本数据对应的目标文本信息进行编码，得到高维语音特征，进而根据风格信息再对高维语音特征进行调整，得到由目标语音特征生成的目标语音，使得通过文本内容生成的语音更为准确，更符合真实语音。

技术关键词

语音特征语音生成方法风格文本数据分支样本人物动画标签上采样编码模块深度学习网络标记编码器神经网络模型信息编码场景

系统为您推荐了相关专利信息

一种配电网故障预测定位方法及系统

预测定位方法配电网故障故障预测模型子模块贡献率

一种基于机械加速的澄清池污水处理控制方法及系统

机械运行参数污水处理控制方法浊度神经网络模型构建澄清池

龙眼可溶性固形物分级检测装置及方法

龙眼可溶性固形物含量分级检测装置分级检测方法波长

标签生成方法及装置

多模态数据标签生成方法标签生成装置服务端

一种基于多维度风险分析的应用程序安全测试系统

识别模块安全漏洞信息静态代码分析图谱漏洞数据库

直播语音生成方法及其系统

站点导航

APP 下载