文本合成语音方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510286084

申请日期：2025-03-11

公开号：CN120126446A

公开日期：2025-06-10

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种文本合成语音方法、装置、计算机设备及存储介质，应用于金融交易信息语音合成场景和医疗诊单信息语音合成场景中，其中，所述方法包括：获取初始文本音频对，并对所述初始文本音频对进行预处理，生成训练数据集和验证数据集；采用最大似然估计的方式基于所述训练数据集对自回归生成模型进行优化处理，以对所述自回归生成模型进行模型训练，生成目标语音合成模型；获取待合成文本，通过所述目标语音合成模型基于所述待合成文本以自回归方式生成标记序列；通过对所述标记序列进行解码生成目标语音信息。本发明有利于提高文本合成语音的准确性和效率。

技术关键词

语音方法生成训练数据序列标记文本编码器计算机设备金融交易信息注意力音频编码器模型训练模块可读存储介质音频解码人工智能技术

系统为您推荐了相关专利信息

基于多尺度Retinex算法的电力通道异物智能检测系统及方法

智能检测系统风险评估值电力影像智能检测模块

一种网约车风险订单的监控方法及装置

风险订单监控方法网络模型训练数据特征工程异常订单

一种智能体集群路径规划模型的训练方法和装置

强化学习模型集群矩阵网络序列

家居控制方法及家居控制场景学习方法、系统

家居控制系统家居控制方法家电设备大语言模型多模态

会议智能管理系统及方法

会议智能管理方法智能管理系统标记计算机设备数据

文本合成语音方法、装置、计算机设备及存储介质

站点导航

APP 下载