基于声学模型的语音识别方法、计算机设备和存储介质

AITNT
正文
推荐专利
基于声学模型的语音识别方法、计算机设备和存储介质
申请号:CN202511286713
申请日期:2025-09-10
公开号:CN120783731B
公开日期:2025-11-25
类型:发明专利
摘要
本发明属于声音识别领域,公开了一种基于声学模型的语音识别方法、计算机设备和存储介质。方法包括:获取待识别语音的语音特征;将语音特征输入声学模型,由模型输出识别结果;其中,时序处理网络层通过预训练的门控融合单元,先确定当前输入需预看未来帧占上下文信息的比值,再基于该比值计算预看未来帧数量并获取对应未来帧,结合未来帧计算长时上下文表示,处理后输出给下一层网络。本发明通过动态调整预看未来帧数量,解决了现有技术中延迟与准确率静态绑定的问题,对简单命令词实现低延迟响应,对易混淆指令通过多预看未来帧提升识别准确率,实现延迟与准确率的平衡,提升了语音识别系统性能与用户体验。
技术关键词
语音识别方法 辅助分类器 语音特征 时序 联合损失函数 计算机设备 语音识别系统 置信度阈值 网络 处理器 低延迟 可读存储介质 存储器 记忆 命令 序列 动态
系统为您推荐了相关专利信息
1
一种基于多源数据多任务学习模型的锂离子电池健康状态预测方法和装置
多任务学习模型 数据 时序 锂离子电池老化 健康状态预测
2
训练自调节的多模块烟草制丝生产出口含水率预测方法
门控循环单元 烟丝工艺 气体阀门 蒸汽阀门 时序
3
一种用于视频分类的方法、装置及设备
视频 视觉特征 融合特征 点云特征 LSTM模型
4
一种结合机器学习的泌尿数据采集方法及系统
网络安全监测 网络监测数据 特征提取单元 动态密钥 日志
5
一种输液监测方法、系统、设备和存储介质
输液监测方法 场景 识别置信度 计算机可读指令 输液监测系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号