文本转换语音的方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411527402

申请日期：2024-10-29

公开号：CN119517004B

公开日期：2025-11-18

类型：发明专利

摘要

本发明实施例提供一种文本转换语音的方法、装置、设备及存储介质。方法包括：获取目标文本，并确定所述目标文本对应的语义信息；通过目标大语言模型中的语音分词器对所述语义信息进行处理，得到所述目标文本对应的离散语音令牌，其中，所述离散语音令牌包括所述语义信息对应的编码信息；基于所述编码信息，确定所述离散语音令牌对应的位置信息；以及，通过所述目标大语言模型中的声码器对所述离散语音令牌进行预测，得到所述离散语音令牌对应的语音信号；用于按照所述位置信息所述语音信号进行排序，得到所述目标文本对应的目标语音流。本申请实施例旨在文本转换语音过程中，实现较强的语义关联，提高文本转换语音的准确率与效率。

技术关键词

大语言模型语音文本令牌语义训练集卷积编码器处理器可读存储介质信号存储器计算机设备模块程序数据分词索引数值

系统为您推荐了相关专利信息

一种数据智能标注方法和系统

智能标注方法样本数据清洗方法文本历史工单数据

一种基于人工智能的试题知识点标注方法及系统

知识点标注方法分词生成知识图谱标注系统基础

油样采集机器人导航用的关键部位点云分割方法及系统

点云分割方法多尺度局部特征注意力机制反距离加权插值多层感知机层

基于LSTM-iTransformer的室内环境数据预测方法及系统

数据预测方法时序特征注意力多层感知机 LSTM神经网络

一种物联感知设备快速接入系统

协议特征射频特征设备驱动程序特征提取模块标识符

文本转换语音的方法、装置、设备及存储介质

站点导航

APP 下载