一种基于大语言模型的语音识别方法、装置及设备

正文

推荐专利

申请号：CN202510830908

申请日期：2025-06-20

公开号：CN120412560A

公开日期：2025-08-01

类型：发明专利

摘要

本说明书实施例提供一种基于大语言模型的语音识别方法。该方法包括：获取待输入语音；通过音频编码器从待输入语音中提取语音特征；利用连接时序分类预测层对所述语音特征进行解码，得到连接时序分类预测结果；将所述语音特征和连接时序分类预测结果作为提示内容输入至大语言模型，所述大语言模型根据所述提示内容生成语音识别结果。通过本发明提供的方法，可以缓解大语言模型的幻觉问题，能够提升语音识别的准确性。

技术关键词

大语言模型语音特征时序语音识别方法字符生成语音音频编码器语音识别装置语音识别模块特征提取模块序列解码模块处理器矩阵存储器电子设备文本标记

系统为您推荐了相关专利信息

一种农作物全生长季多光谱遥感时间序列影像近实时重建方法、装置、设备及介质

时序遥感影像时间序列影像扩展卡尔曼滤波算法植被指数数据变化检测算法

基于Java的大语言模型动态适配方法及系统

大语言模型动态适配方法分块适配器支持混合索引

一种少样本多维时间序列异常检测方法、系统、设备及介质

频域特征序列时域特征预训练语言模型重构模型

气液界面识别与船舶晃荡液位修正方法和系统

轻量卷积神经网络修正方法时序预测模型灰度纹理特征修正液

一种基于信息增强型多模态大模型的分子逆合成方法

多模态分子信息处理模型微调技术大语言模型

一种基于大语言模型的语音识别方法、装置及设备

站点导航

APP 下载