摘要
本发明公开了一种基于对比学习的儿童语音表达错误识别与纠正方法,包括:对输入的儿童语音信号进行预处理,得到对数梅尔频谱特征序列,通过改进的Transformer编码器转换为语音语义编码特征;基于年龄自适应正负样本选择机制,利用对比学习方法优化语音特征,获得增强的语音表示向量;构建多模态融合网络,结合增强的语音向量与BERT语言模型特征,通过多头交叉注意力和门控机制实现自适应融合,采用双向LSTM设计错误定位模块识别发音错误位置和类型,使用联合损失函数执行端到端训练;根据错误类型生成标准纠正音频,为儿童提供纠正指导。本发明实现儿童语音表达错误的高精度识别、定位和纠正,为儿童语言发展提供技术支撑。
技术关键词
语音
纠正方法
样本
错误检测
儿童
频谱特征
发音
年龄
编码器
全局平均池化
序列
交叉注意力机制
联合损失函数
语义
模态特征
网络
多模态
文本
高频特征
系统为您推荐了相关专利信息
样本
视频录制设备
因子
企业内部数据
音频采集设备
轻度认知障碍
评估系统
语音识别模型
信息展示页面
图片
铣削力预测
切削力预测模型
高斯核函数
粒子
硬质合金立铣刀