摘要
本发明涉及语音处理技术领域,特别是涉及跨模态对抗生成的中文声调纠错系统及其方法,系统包括多通道声调频谱特化分解模块,用于并行处理语音信号,提取多尺度声调特征;自适应频谱注意力掩码模块,生成频谱增强掩码,对与声调特征相关的频率区域进行动态增强;声调表征模块,通过对比学习生成声调表征向量;声调错误检测模块,分析声调表征向量确定声调错误类型和错误模式;多模态反馈模块,基于声调错误类型和错误模式生成声调发音与舌位动作综合指导反馈,提高声调错误检测准确率,该系统通过多通道声调频谱特化分解和自适应频谱注意力掩码技术,将声调错误检出率提升至95%,准确率达92%,特别是对第三声的检测准确率显著提高。
技术关键词
错误检测模块
频谱特征
纠正策略
纠错系统
低频段
多通道
发音
跨模态
注意力机制
多尺度特征提取
多模态
声调轮廓
语音
编码器单元
生成多尺度
样本
系统为您推荐了相关专利信息
动力电缆
风力发电机组电缆
振动特征参数
数据采集层
模式识别
智能生成方法
意图识别模型
情感分析模型
关键词
文本
水泵设备
故障预测模型
故障预测方法
历史运行数据
噪声
智能脱缆钩
环境状态预测
深度循环神经网络
永磁电磁结构
动作策略
英语教学辅助系统
学生
优化缩放因子
文本
频谱特征提取