摘要
本申请公开了一种语音识别方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于若干对同音词和近音词构建目标数据集,并基于目标数据集对第一自动语音识别模型进行微调得到第三自动语音识别模型;确定目标音频的声学特征序列,并生成声学特征序列对应的候选词元序列,基于候选词元序列和声学特征序列生成各候选词元的熵值;将高于预设阈值的熵值对应的候选词元确定为待修正词元,若待修正词元对应的错误类型为术语错误,则基于目标领域知识库对待修正词元进行修正;若待修正词元对应的错误类型为歧义错误,则利用第三自动语音识别模型对待修正词元进行修正,基于修正结果确定语音识别结果。本申请可以提升语音识别的准确性和效率。
技术关键词
自动语音识别
语音识别方法
声学特征
解码器
序列
音频
后验概率分布
文本
术语
矩阵
梅尔频率倒谱系数
大语言模型
语音识别装置
数据
编码器
波形
存储计算机程序
人工智能技术
键值
系统为您推荐了相关专利信息
空间管理方法
LED灯具
序列二次规划算法
灰阶亮度曲线
PWM占空比
三维点云序列数据
智能识别方法
编码向量
动态反馈控制
禽舍
业务调度方法
编码特征
指派
优化业务
计算机程序产品