一种文本到语音生成方法

AITNT
正文
推荐专利
一种文本到语音生成方法
申请号:CN202411539820
申请日期:2024-10-31
公开号:CN119049447B
公开日期:2025-01-10
类型:发明专利
摘要
本发明公开了一种文本到语音生成方法,属于语音生成技术领域,能够解决现有文本到语音系统语音合成效率低、且依赖对齐信息的问题。所述方法包括:S1、获取参考语音的自监督特征,并对自监督特征进行离散化处理,得到参考语义标记序列;S2、根据文本标记序列和参考语义标记序列,得到目标语义标记序列;S3、对目标语义标记序列进行预测,得到多层声学标记序列,并根据多层声学标记序列生成目标语音。本发明用于生成目标语音。
技术关键词
语义 语音生成方法 标记 序列 编解码器 文本 语音生成技术 神经网络模型 语音系统 编码器 模块
系统为您推荐了相关专利信息
1
一种基于用电场景的配电系统综合效益计算方法及系统
效益计算方法 配电系统 功率稳定 场景 多时间尺度
2
一种面向大模型生成内容信息安全强化的系统及方法
编辑 样本 知识蒸馏技术 细粒度分类 数据
3
一种基于多模态的指令处理方法及装置
指令 上下文特征 意图 多模态 大语言模型
4
一种基于工业互联网的智能语音识别方法
智能语音识别方法 工业互联网 生成特征向量 麦克风阵列 多模态
5
一种电表生产质量追溯系统及方法
数据采集子系统 时域特征提取 频域特征提取 分析子系统 语义分割算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号