一种分层编解码语音合成方法、装置、设备及介质

正文

推荐专利

申请号：CN202510675453

申请日期：2025-05-23

公开号：CN120472881A

公开日期：2025-08-12

类型：发明专利

摘要

本发明涉及语音合成技术领域，可应用于金融科技、医疗健康等业务系统平台中，公开了分层编解码语音合成方法、装置、设备及介质，对预先获取的原始文本进行语义特征提取，得到文本语义特征；对原始文本进行韵律特征提取，得到文本韵律特征；将文本语义特征与文本韵律特征进行特征融合压缩，得到融合压缩特征；对融合压缩特征进行低频解码，得到低频解码特征；对融合压缩特征进行高频解码，得到高频解码特征；将所述低频解码特征和所述高频解码特征合并，并将合并特征转换为目标合成语音。通过高低频解码，还原出更丰富、更准确的语音细节，使合成语音听起来更加自然流畅，提高了语音的可信度和流畅性。

技术关键词

分层编解码压缩特征韵律特征文本语义特征提取语音分词双向长短期记忆网络卷积特征注意力解码模块融合特征波形可读存储介质高频特征医疗健康处理器业务系统

系统为您推荐了相关专利信息

基于图结构数据的验证方法、装置、电子设备及存储介质

文本关键词实体智能问答系统答案

一种基于深度学习的生殖健康智能护理决策方法及系统

决策方法监控视频图像特征工程决策系统风险

一种工程质量风险隐患智能评级方法及系统

智能评级方法风险数据文本分词

基于图像-文本大模型的岩石岩性智能识别方法及系统

智能识别方法文本生成器岩性智能识别系统高维特征向量深度学习超参数

基于大语言模型的电力系统数字孪生体交互方法及系统

大语言模型仿真平台数字孪生体基础元件多智能体系统

一种分层编解码语音合成方法、装置、设备及介质

站点导航

APP 下载