直播语音生成方法及其系统

AITNT
正文
推荐专利
直播语音生成方法及其系统
申请号:CN202410981009
申请日期:2024-07-22
公开号:CN119052515A
公开日期:2024-11-29
类型:发明专利
摘要
本发明涉及计算机技术领域,公开了一种直播语音生成方法及其系统,包括:接收第一直播输入数据;第一直播输入数据包括文本数据和风格信息;获取文本数据对应的目标文本信息;对风格信息进行第一编码,得到目标风格特征,并对目标文本信息和目标风格特征进行第二编码,得到高维语音特征;根据风格信息对高维语音特征进行调整,得到与风格信息对应的目标语音特征,并根据目标语音特征生成目标语音。本发明通过由风格信息编码得到的目标风格特征与文本数据对应的目标文本信息进行编码,得到高维语音特征,进而根据风格信息再对高维语音特征进行调整,得到由目标语音特征生成的目标语音,使得通过文本内容生成的语音更为准确,更符合真实语音。
技术关键词
语音特征 语音生成方法 风格 文本 数据 分支 样本 人物动画 标签 上采样 编码模块 深度学习网络 标记 编码器 神经网络模型 信息编码 场景
系统为您推荐了相关专利信息
1
一种配电网故障预测定位方法及系统
预测定位方法 配电网故障 故障预测模型 子模块 贡献率
2
一种基于机械加速的澄清池污水处理控制方法及系统
机械运行参数 污水处理控制方法 浊度 神经网络模型构建 澄清池
3
龙眼可溶性固形物分级检测装置及方法
龙眼 可溶性固形物含量 分级检测装置 分级检测方法 波长
4
标签生成方法及装置
多模态 数据 标签生成方法 标签生成装置 服务端
5
一种基于多维度风险分析的应用程序安全测试系统
识别模块 安全漏洞信息 静态代码分析 图谱 漏洞数据库
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号