摘要
本发明公开的基于卷积注意力机制改进的KAC‑Transformer智能音箱语音识别方法,构建改进网络模型并进行训练,通过编码器对音频数据的特征编码,提取并增强特征信息,再利用GR‑KAN对特征进行非线性映射,之后解码特征信息并重构为模型识别后的文本数据;将编码器输出的特征数据和编码后的文本标签输入CTC计算损失值以及解码器的输出和编码后的文本标签输入CE,通过超参数调整两个参数的比例后更新模型参数,训练完成后冻结模型参数,切换验证集并调优模型超参数。本发明有效降低了模型的复杂度,增强了模型在处理复杂音频场景中的鲁棒性,同时实现了高效的语音识别效果,提升了智能音箱中的语音识别准确率。
技术关键词
语音识别方法
注意力机制
智能音箱
矩阵
解码器
样条
加权特征
编码器
音频
通道
网格
短时傅里叶变换
模块
更新模型参数
文本
语音识别准确率
语音识别网络
数据
超参数
系统为您推荐了相关专利信息
检测跟踪方法
形态
表达式
轮廓边缘
合成孔径雷达
任务调度策略
资源分配方法
多层感知机
模糊推理规则
优先级调度策略
血管
ROI图像
转移预测方法
空间框架
语义分割模型