摘要
本发明实施例提供一种文本转换语音的方法、装置、设备及存储介质。方法包括:获取目标文本,并确定所述目标文本对应的语义信息;通过目标大语言模型中的语音分词器对所述语义信息进行处理,得到所述目标文本对应的离散语音令牌,其中,所述离散语音令牌包括所述语义信息对应的编码信息;基于所述编码信息,确定所述离散语音令牌对应的位置信息;以及,通过所述目标大语言模型中的声码器对所述离散语音令牌进行预测,得到所述离散语音令牌对应的语音信号;用于按照所述位置信息所述语音信号进行排序,得到所述目标文本对应的目标语音流。本申请实施例旨在文本转换语音过程中,实现较强的语义关联,提高文本转换语音的准确率与效率。
技术关键词
大语言模型
语音
文本
令牌
语义
训练集
卷积编码器
处理器
可读存储介质
信号
存储器
计算机设备
模块
程序
数据
分词
索引
数值
系统为您推荐了相关专利信息
智能标注方法
样本
数据清洗方法
文本
历史工单数据
知识点标注方法
分词
生成知识图谱
标注系统
基础
点云分割方法
多尺度局部特征
注意力机制
反距离加权插值
多层感知机层
数据预测方法
时序特征
注意力
多层感知机
LSTM神经网络
协议特征
射频特征
设备驱动程序
特征提取模块
标识符