基于卷积注意力机制改进的KAC-Transformer智能音箱语音识别方法

正文

推荐专利

申请号：CN202510714792

申请日期：2025-05-30

公开号：CN120544563A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开的基于卷积注意力机制改进的KAC‑Transformer智能音箱语音识别方法，构建改进网络模型并进行训练，通过编码器对音频数据的特征编码，提取并增强特征信息，再利用GR‑KAN对特征进行非线性映射，之后解码特征信息并重构为模型识别后的文本数据；将编码器输出的特征数据和编码后的文本标签输入CTC计算损失值以及解码器的输出和编码后的文本标签输入CE，通过超参数调整两个参数的比例后更新模型参数，训练完成后冻结模型参数，切换验证集并调优模型超参数。本发明有效降低了模型的复杂度，增强了模型在处理复杂音频场景中的鲁棒性，同时实现了高效的语音识别效果，提升了智能音箱中的语音识别准确率。

技术关键词

语音识别方法注意力机制智能音箱矩阵解码器样条加权特征编码器音频通道网格短时傅里叶变换模块更新模型参数文本语音识别准确率语音识别网络数据超参数

系统为您推荐了相关专利信息

工单审核方法、装置、电子设备及可读存储介质

预训练语言模型场景类别条目审核方法语句

组合式空调矩阵的协同控制方法

监测传感器协同控制方法组合式空调变量矩阵

一种SAR图像目标检测跟踪方法

检测跟踪方法形态表达式轮廓边缘合成孔径雷达

基于多维度动态评估的算力资源分配方法、系统及产品

任务调度策略资源分配方法多层感知机模糊推理规则优先级调度策略

基于血管标志的淋巴结转移预测方法、装置及存储介质

血管 ROI图像转移预测方法空间框架语义分割模型

基于卷积注意力机制改进的KAC-Transformer智能音箱语音识别方法

站点导航

APP 下载