摘要
本申请属于金融科技技术领域,提供了一种语音合成处理方法、装置及相关设备,为了解决传统技术中合成语音和真人语音的相似度较低的问题,通过获取待转换成语音的文本,并获取提示文本,且确定离散语义令牌,再基于预设文本语音大语言模型,根据提示文本,建立文本与离散语义令牌的对齐关系,得到文本对应的目标离散语义令牌,再基于预设条件流匹配模型,确定目标离散语义令牌对应的语音谱特征,并基于预设语音合成解码器,将语音谱特征生成语音信号,得到语音,能够提高语音合成和真人语音的相似度,例如,对于保险业务或者银行业务的自助语音服务,采用上述方式合成语音,能够使合成语音与真人语音有较高的相似度。
技术关键词
文本
令牌
语义
大语言模型
生成语音信号
语音识别模型
语音解码器
语音编码器
多语言语音识别
自助语音服务
金融科技技术
关系
量化器
计算机设备
存储计算机程序
存储器