基于卷积注意力机制改进的KAC-Transformer智能音箱语音识别方法

AITNT
正文
推荐专利
基于卷积注意力机制改进的KAC-Transformer智能音箱语音识别方法
申请号:CN202510714792
申请日期:2025-05-30
公开号:CN120544563A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开的基于卷积注意力机制改进的KAC‑Transformer智能音箱语音识别方法,构建改进网络模型并进行训练,通过编码器对音频数据的特征编码,提取并增强特征信息,再利用GR‑KAN对特征进行非线性映射,之后解码特征信息并重构为模型识别后的文本数据;将编码器输出的特征数据和编码后的文本标签输入CTC计算损失值以及解码器的输出和编码后的文本标签输入CE,通过超参数调整两个参数的比例后更新模型参数,训练完成后冻结模型参数,切换验证集并调优模型超参数。本发明有效降低了模型的复杂度,增强了模型在处理复杂音频场景中的鲁棒性,同时实现了高效的语音识别效果,提升了智能音箱中的语音识别准确率。
技术关键词
语音识别方法 注意力机制 智能音箱 矩阵 解码器 样条 加权特征 编码器 音频 通道 网格 短时傅里叶变换 模块 更新模型参数 文本 语音识别准确率 语音识别网络 数据 超参数
系统为您推荐了相关专利信息
1
工单审核方法、装置、电子设备及可读存储介质
预训练语言模型 场景类别 条目 审核方法 语句
2
组合式空调矩阵的协同控制方法
监测传感器 协同控制方法 组合式空调 变量 矩阵
3
一种SAR图像目标检测跟踪方法
检测跟踪方法 形态 表达式 轮廓边缘 合成孔径雷达
4
基于多维度动态评估的算力资源分配方法、系统及产品
任务调度策略 资源分配方法 多层感知机 模糊推理规则 优先级调度策略
5
基于血管标志的淋巴结转移预测方法、装置及存储介质
血管 ROI图像 转移预测方法 空间框架 语义分割模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号