构音障碍语音的个性化合成与识别增强方法

正文

推荐专利

构音障碍语音的个性化合成与识别增强方法

申请号：CN202510359114

申请日期：2025-03-25

公开号：CN120412540A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种构音障碍语音的个性化合成与识别增强方法，构音障碍语音合成模型包括：长程依赖特征编码模块、非稳态特征编码模块和解码模块，构音障碍语音合成模型的输入包括样本，输出包括合成构音障碍语音，样本为构音障碍文本序列；长程依赖特征编码模块的输入包括样本、输出为对齐向量z；非稳态特征编码模块的输入包括对齐向量z、输出为最终嵌入表示解码模块的输入为最终嵌入表示输出为合成构音障碍语音。本发明的构音障碍语音合成模型提升了对构音障碍语音个性化特征的提取能力和语音合成性能以及构音障碍语音特征的精细化表达能力。

技术关键词

编码模块稳态特征特征提取模块随机噪声依赖特征解码模块对齐模块样本音频语音识别模型个性化特征语音特征序列错误率文本阶段

系统为您推荐了相关专利信息

基于光谱异常区域感知的污渍检测方法及装置

污渍检测方法图像编码器多光谱特征图像处理模块注意力机制

一种毛笔清洗机喷头运行轨迹控制系统

毛笔清洗机轨迹控制系统神经网络模型数据项图像获取单元

基于卷积门控循环注意力网络CGAFNet的卫星云图临近预报方法

临近预报方法卫星云图注意力门控循环单元网络特征提取模块

脑电信号处理方法及脑机交互系统

脑电信号处理方法数据滑动窗口脑机交互系统外部设备

一种基于改进SSD算法的轻量级行人检测方法、系统、设备及介质

SSD算法行人检测模型行人检测方法注意力机制行人识别

构音障碍语音的个性化合成与识别增强方法

站点导航

APP 下载