摘要
本发明涉及语音合成技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了分层编解码语音合成方法、装置、设备及介质,对预先获取的原始文本进行语义特征提取,得到文本语义特征;对原始文本进行韵律特征提取,得到文本韵律特征;将文本语义特征与文本韵律特征进行特征融合压缩,得到融合压缩特征;对融合压缩特征进行低频解码,得到低频解码特征;对融合压缩特征进行高频解码,得到高频解码特征;将所述低频解码特征和所述高频解码特征合并,并将合并特征转换为目标合成语音。通过高低频解码,还原出更丰富、更准确的语音细节,使合成语音听起来更加自然流畅,提高了语音的可信度和流畅性。
技术关键词
分层编解码
压缩特征
韵律特征
文本
语义特征提取
语音
分词
双向长短期记忆网络
卷积特征
注意力
解码模块
融合特征
波形
可读存储介质
高频特征
医疗健康
处理器
业务系统
系统为您推荐了相关专利信息
智能识别方法
文本生成器
岩性智能识别系统
高维特征向量
深度学习超参数
大语言模型
仿真平台
数字孪生体
基础元件
多智能体系统