一种基于上下文适应器和偏置损失的语音识别方法及系统

正文

推荐专利

申请号：CN202410762066

申请日期：2024-06-13

公开号：CN118711571A

公开日期：2024-09-27

类型：发明专利

摘要

本发明公开了一种基于上下文适应器和偏置损失的语音识别方法及系统。针对现有方法面对偏置词表较大时无法正确选择偏置词的问题，本发明采用的技术方案为：利用大规模语音数据进行预训练，基于Transducer结构构建一个基础语音识别模型；将偏置短语输入上下文适应器编码为偏置向量；将偏置向量与基础语音识别模型的编码输出相加，输入联合网络以完成最终的预测，得到最终的预测文本；对含有偏置短语的数据进行偏置学习，对最终的预测文本进行Transducer学习，利用偏置学习损失和Transducer学习损失对上下文适应器进行微调。本发明引入上下文适应器与偏置损失函数，提高了语音识别模型对于不常见短语的识别准确性。

技术关键词

语音识别模型多头注意力机制文本语音识别方法大规模语音数据语音识别系统音频 LSTM模型网络编码器基础目录索引微调单元参数代表

系统为您推荐了相关专利信息

一种应急问答大模型构建方法、系统、设备及介质

大语言模型模型构建方法数据多轮对话指令生成技术

一种蛋白质翻译后修饰与疾病关联预测系统及方法

蛋白质翻译后修饰多头注意力机制特征提取模块 Adam算法疾病关联预测方法

一种图像描述文本的生成方法及装置

文本语句答案生成方法图像分析模型

一种基于微调大语言模型的配电网状态估计方法及系统

配电网状态估计大语言模型训练集数据注意力机制电力系统状态估计

一种基于大模型的单据识别方法、系统及设备

光学字符识别单据识别方法合规性多语言

一种基于上下文适应器和偏置损失的语音识别方法及系统

站点导航

APP 下载