一种基于BERT预训练语言模型的语音指令识别方法

正文

推荐专利

申请号：CN202411591268

申请日期：2024-11-08

公开号：CN119479646B

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及语音识别技术领域，公开了一种基于BERT预训练语言模型的语音指令识别方法，该方法包括：接收待识别语音，并通过自动语音识别模型将待识别语音转化为文本序列；微调BERT预训练语言模型，并利用微调后的BERT预训练语言模型对文本序列进行文本分类，得到待识别语音对应的指令类别；利用知识蒸馏对微调后的BERT预训练语言模型进行模型压缩，得到序列分类模型；利用序列分类模型对文本序列进行特征提取，得到待识别语音对应的指令类别标签，本发明考虑到音频数据较文本数据更难获取的情况，选用BERT预训练语言模型，提高分类准确性，利用知识蒸馏进行模型压缩，识别到待识别语音指令类别标签，为人机交互提供数据支撑。

技术关键词

训练语言模型语音指令识别方法自动语音识别模型压缩文本序列识别语音指令蒸馏标签语音识别技术学生可读存储介质特征提取模块解码器计算机程序产品编码器

一种基于BERT预训练语言模型的语音指令识别方法

站点导航

APP 下载