摘要
本发明公开了一种构音障碍语音的个性化合成与识别增强方法,构音障碍语音合成模型包括:长程依赖特征编码模块、非稳态特征编码模块和解码模块,构音障碍语音合成模型的输入包括样本,输出包括合成构音障碍语音,样本为构音障碍文本序列;长程依赖特征编码模块的输入包括样本、输出为对齐向量z;非稳态特征编码模块的输入包括对齐向量z、输出为最终嵌入表示解码模块的输入为最终嵌入表示输出为合成构音障碍语音。本发明的构音障碍语音合成模型提升了对构音障碍语音个性化特征的提取能力和语音合成性能以及构音障碍语音特征的精细化表达能力。
技术关键词
编码模块
稳态特征
特征提取模块
随机噪声
依赖特征
解码模块
对齐模块
样本
音频
语音识别模型
个性化特征
语音特征
序列
错误率
文本
阶段
系统为您推荐了相关专利信息
污渍检测方法
图像编码器
多光谱特征
图像处理模块
注意力机制
毛笔清洗机
轨迹控制系统
神经网络模型
数据项
图像获取单元
临近预报方法
卫星云图
注意力
门控循环单元网络
特征提取模块
脑电信号处理方法
数据
滑动窗口
脑机交互系统
外部设备
SSD算法
行人检测模型
行人检测方法
注意力机制
行人识别