面向类人表达的方言语音合成方法、装置、设备及介质

AITNT
正文
推荐专利
面向类人表达的方言语音合成方法、装置、设备及介质
申请号:CN202510095120
申请日期:2025-01-21
公开号:CN119905084A
公开日期:2025-04-29
类型:发明专利
摘要
本发明涉及语音合成及医疗健康领域,公开了一种面向类人表达的方言语音合成方法、装置、设备及介质,包括:对预先获取的训练文本进行文本特征提取以及文本特征标记,得到标记文本特征;对预先获取的训练语音进行语音特征提取以及语音特征标记,得到标记语音特征;利用所述标记文本特征对所述标记语音特征进行标记对齐,得到对齐训练数据集;利用所述对齐训练数据集对预设的语音合成模型进行模型训练,得到初级语音模型;利用所述对齐训练数据集对所述初级语音模型进行交叉注意力扩散,得到方言语音模型;获取医疗诊断回复文本,利用所述方言语音模型生成所述医疗诊断回复文本对应的回复音频。本发明能够提升合成方言语音的效率。
技术关键词
文本 标记 语音特征提取 语音特征数据 注意力 词特征 无监督 频谱特征 序列 音频特征 模型更新 模型训练模块 可读存储介质 医疗健康 对齐模块 处理器
系统为您推荐了相关专利信息
1
基于可控迁移对抗样本的黑盒模型验证方法
黑盒模型 样本 验证方法 注意力机制 多层感知机
2
一种锂离子电池寿命预测方法及协同驱动模型的训练方法
深度学习模型 电池 注意力机制 数据 材料特征
3
雪茄烟缺陷检测方法、装置、设备、存储介质及程序产品
缺陷烟支 雪茄烟 样本 图像 预测类别
4
基于大语言模型的虫媒传染病知识图谱构建方法及装置
虫媒传染病 知识图谱构建方法 大语言模型 实体 模板
5
基于MS-CAM改进特征融合模块的弱小目标识别方法
识别方法 模块 信道 通道 CAM结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号