面向类人表达的方言语音合成方法、装置、设备及介质

正文

推荐专利

申请号：CN202510095120

申请日期：2025-01-21

公开号：CN119905084A

公开日期：2025-04-29

类型：发明专利

摘要

本发明涉及语音合成及医疗健康领域，公开了一种面向类人表达的方言语音合成方法、装置、设备及介质，包括：对预先获取的训练文本进行文本特征提取以及文本特征标记，得到标记文本特征；对预先获取的训练语音进行语音特征提取以及语音特征标记，得到标记语音特征；利用所述标记文本特征对所述标记语音特征进行标记对齐，得到对齐训练数据集；利用所述对齐训练数据集对预设的语音合成模型进行模型训练，得到初级语音模型；利用所述对齐训练数据集对所述初级语音模型进行交叉注意力扩散，得到方言语音模型；获取医疗诊断回复文本，利用所述方言语音模型生成所述医疗诊断回复文本对应的回复音频。本发明能够提升合成方言语音的效率。

技术关键词

文本标记语音特征提取语音特征数据注意力词特征无监督频谱特征序列音频特征模型更新模型训练模块可读存储介质医疗健康对齐模块处理器

系统为您推荐了相关专利信息

基于可控迁移对抗样本的黑盒模型验证方法

黑盒模型样本验证方法注意力机制多层感知机

一种锂离子电池寿命预测方法及协同驱动模型的训练方法

深度学习模型电池注意力机制数据材料特征

雪茄烟缺陷检测方法、装置、设备、存储介质及程序产品

缺陷烟支雪茄烟样本图像预测类别

基于大语言模型的虫媒传染病知识图谱构建方法及装置

虫媒传染病知识图谱构建方法大语言模型实体模板

基于MS-CAM改进特征融合模块的弱小目标识别方法

识别方法模块信道通道 CAM结构

面向类人表达的方言语音合成方法、装置、设备及介质

站点导航

APP 下载