语音合成处理方法、装置及相关设备

AITNT
正文
推荐专利
语音合成处理方法、装置及相关设备
申请号:CN202411465306
申请日期:2024-10-18
公开号:CN119479608B
公开日期:2025-11-28
类型:发明专利
摘要
本申请属于金融科技技术领域,提供了一种语音合成处理方法、装置及相关设备,为了解决传统技术中合成语音和真人语音的相似度较低的问题,通过获取待转换成语音的文本,并获取提示文本,且确定离散语义令牌,再基于预设文本语音大语言模型,根据提示文本,建立文本与离散语义令牌的对齐关系,得到文本对应的目标离散语义令牌,再基于预设条件流匹配模型,确定目标离散语义令牌对应的语音谱特征,并基于预设语音合成解码器,将语音谱特征生成语音信号,得到语音,能够提高语音合成和真人语音的相似度,例如,对于保险业务或者银行业务的自助语音服务,采用上述方式合成语音,能够使合成语音与真人语音有较高的相似度。
技术关键词
文本 令牌 语义 大语言模型 生成语音信号 语音识别模型 语音解码器 语音编码器 多语言语音识别 自助语音服务 金融科技技术 关系 量化器 计算机设备 存储计算机程序 存储器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号