文本转换语音的方法、装置、设备及存储介质

AITNT
正文
推荐专利
文本转换语音的方法、装置、设备及存储介质
申请号:CN202411527402
申请日期:2024-10-29
公开号:CN119517004B
公开日期:2025-11-18
类型:发明专利
摘要
本发明实施例提供一种文本转换语音的方法、装置、设备及存储介质。方法包括:获取目标文本,并确定所述目标文本对应的语义信息;通过目标大语言模型中的语音分词器对所述语义信息进行处理,得到所述目标文本对应的离散语音令牌,其中,所述离散语音令牌包括所述语义信息对应的编码信息;基于所述编码信息,确定所述离散语音令牌对应的位置信息;以及,通过所述目标大语言模型中的声码器对所述离散语音令牌进行预测,得到所述离散语音令牌对应的语音信号;用于按照所述位置信息所述语音信号进行排序,得到所述目标文本对应的目标语音流。本申请实施例旨在文本转换语音过程中,实现较强的语义关联,提高文本转换语音的准确率与效率。
技术关键词
大语言模型 语音 文本 令牌 语义 训练集 卷积编码器 处理器 可读存储介质 信号 存储器 计算机设备 模块 程序 数据 分词 索引 数值
系统为您推荐了相关专利信息
1
一种数据智能标注方法和系统
智能标注方法 样本 数据清洗方法 文本 历史工单数据
2
一种基于人工智能的试题知识点标注方法及系统
知识点标注方法 分词 生成知识图谱 标注系统 基础
3
油样采集机器人导航用的关键部位点云分割方法及系统
点云分割方法 多尺度局部特征 注意力机制 反距离加权插值 多层感知机层
4
基于LSTM-iTransformer的室内环境数据预测方法及系统
数据预测方法 时序特征 注意力 多层感知机 LSTM神经网络
5
一种物联感知设备快速接入系统
协议特征 射频特征 设备驱动程序 特征提取模块 标识符
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号