一种语音识别方法、装置、设备及存储介质

AITNT
正文
推荐专利
一种语音识别方法、装置、设备及存储介质
申请号:CN202511377844
申请日期:2025-09-25
公开号:CN120998187A
公开日期:2025-11-21
类型:发明专利
摘要
本申请公开了一种语音识别方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于若干对同音词和近音词构建目标数据集,并基于目标数据集对第一自动语音识别模型进行微调得到第三自动语音识别模型;确定目标音频的声学特征序列,并生成声学特征序列对应的候选词元序列,基于候选词元序列和声学特征序列生成各候选词元的熵值;将高于预设阈值的熵值对应的候选词元确定为待修正词元,若待修正词元对应的错误类型为术语错误,则基于目标领域知识库对待修正词元进行修正;若待修正词元对应的错误类型为歧义错误,则利用第三自动语音识别模型对待修正词元进行修正,基于修正结果确定语音识别结果。本申请可以提升语音识别的准确性和效率。
技术关键词
自动语音识别 语音识别方法 声学特征 解码器 序列 音频 后验概率分布 文本 术语 矩阵 梅尔频率倒谱系数 大语言模型 语音识别装置 数据 编码器 波形 存储计算机程序 人工智能技术 键值
系统为您推荐了相关专利信息
1
多灯珠的多基色LED灯具的色彩空间管理方法及系统
空间管理方法 LED灯具 序列二次规划算法 灰阶亮度曲线 PWM占空比
2
一种环境胁迫下鸡异常采食行为智能识别方法
三维点云序列数据 智能识别方法 编码向量 动态反馈控制 禽舍
3
一种光流估计和场景流估计的方法、设备及介质
特征金字塔 跨模态 蒸馏 点云模型 点云特征
4
一种业务调度方法、装置、设备、介质及产品
业务调度方法 编码特征 指派 优化业务 计算机程序产品
5
电池包故障诊断方法、装置、电子设备、可读存储介质及计算机程序产品
故障诊断方法 滑动窗口 电池包 序列 电压
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号