构音障碍语音的个性化合成与识别增强方法

AITNT
正文
推荐专利
构音障碍语音的个性化合成与识别增强方法
申请号:CN202510359114
申请日期:2025-03-25
公开号:CN120412540A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种构音障碍语音的个性化合成与识别增强方法,构音障碍语音合成模型包括:长程依赖特征编码模块、非稳态特征编码模块和解码模块,构音障碍语音合成模型的输入包括样本,输出包括合成构音障碍语音,样本为构音障碍文本序列;长程依赖特征编码模块的输入包括样本、输出为对齐向量z;非稳态特征编码模块的输入包括对齐向量z、输出为最终嵌入表示解码模块的输入为最终嵌入表示输出为合成构音障碍语音。本发明的构音障碍语音合成模型提升了对构音障碍语音个性化特征的提取能力和语音合成性能以及构音障碍语音特征的精细化表达能力。
技术关键词
编码模块 稳态特征 特征提取模块 随机噪声 依赖特征 解码模块 对齐模块 样本 音频 语音识别模型 个性化特征 语音特征 序列 错误率 文本 阶段
系统为您推荐了相关专利信息
1
基于光谱异常区域感知的污渍检测方法及装置
污渍检测方法 图像编码器 多光谱特征 图像处理模块 注意力机制
2
一种毛笔清洗机喷头运行轨迹控制系统
毛笔清洗机 轨迹控制系统 神经网络模型 数据项 图像获取单元
3
基于卷积门控循环注意力网络CGAFNet的卫星云图临近预报方法
临近预报方法 卫星云图 注意力 门控循环单元网络 特征提取模块
4
脑电信号处理方法及脑机交互系统
脑电信号处理方法 数据 滑动窗口 脑机交互系统 外部设备
5
一种基于改进SSD算法的轻量级行人检测方法、系统、设备及介质
SSD算法 行人检测模型 行人检测方法 注意力机制 行人识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号