语音合成处理方法、装置及相关设备

正文

推荐专利

语音合成处理方法、装置及相关设备

申请号：CN202411465306

申请日期：2024-10-18

公开号：CN119479608B

公开日期：2025-11-28

类型：发明专利

摘要

本申请属于金融科技技术领域，提供了一种语音合成处理方法、装置及相关设备，为了解决传统技术中合成语音和真人语音的相似度较低的问题，通过获取待转换成语音的文本，并获取提示文本，且确定离散语义令牌，再基于预设文本语音大语言模型，根据提示文本，建立文本与离散语义令牌的对齐关系，得到文本对应的目标离散语义令牌，再基于预设条件流匹配模型，确定目标离散语义令牌对应的语音谱特征，并基于预设语音合成解码器，将语音谱特征生成语音信号，得到语音，能够提高语音合成和真人语音的相似度，例如，对于保险业务或者银行业务的自助语音服务，采用上述方式合成语音，能够使合成语音与真人语音有较高的相似度。

技术关键词

文本令牌语义大语言模型生成语音信号语音识别模型语音解码器语音编码器多语言语音识别自助语音服务金融科技技术关系量化器计算机设备存储计算机程序存储器

语音合成处理方法、装置及相关设备

站点导航

APP 下载