摘要
本说明书实施例提供一种基于大语言模型的语音识别方法。该方法包括:获取待输入语音;通过音频编码器从待输入语音中提取语音特征;利用连接时序分类预测层对所述语音特征进行解码,得到连接时序分类预测结果;将所述语音特征和连接时序分类预测结果作为提示内容输入至大语言模型,所述大语言模型根据所述提示内容生成语音识别结果。通过本发明提供的方法,可以缓解大语言模型的幻觉问题,能够提升语音识别的准确性。
技术关键词
大语言模型
语音特征
时序
语音识别方法
字符
生成语音
音频编码器
语音识别装置
语音识别模块
特征提取模块
序列
解码模块
处理器
矩阵
存储器
电子设备
文本
标记
系统为您推荐了相关专利信息
时序遥感影像
时间序列影像
扩展卡尔曼滤波算法
植被指数数据
变化检测算法
大语言模型
动态适配方法
分块
适配器
支持混合索引
频域特征
序列
时域特征
预训练语言模型
重构模型
轻量卷积神经网络
修正方法
时序预测模型
灰度纹理特征
修正液