一种基于大语言模型的语音识别方法、装置及设备

AITNT
正文
推荐专利
一种基于大语言模型的语音识别方法、装置及设备
申请号:CN202510830908
申请日期:2025-06-20
公开号:CN120412560A
公开日期:2025-08-01
类型:发明专利
摘要
本说明书实施例提供一种基于大语言模型的语音识别方法。该方法包括:获取待输入语音;通过音频编码器从待输入语音中提取语音特征;利用连接时序分类预测层对所述语音特征进行解码,得到连接时序分类预测结果;将所述语音特征和连接时序分类预测结果作为提示内容输入至大语言模型,所述大语言模型根据所述提示内容生成语音识别结果。通过本发明提供的方法,可以缓解大语言模型的幻觉问题,能够提升语音识别的准确性。
技术关键词
大语言模型 语音特征 时序 语音识别方法 字符 生成语音 音频编码器 语音识别装置 语音识别模块 特征提取模块 序列 解码模块 处理器 矩阵 存储器 电子设备 文本 标记
系统为您推荐了相关专利信息
1
一种农作物全生长季多光谱遥感时间序列影像近实时重建方法、装置、设备及介质
时序遥感影像 时间序列影像 扩展卡尔曼滤波算法 植被指数数据 变化检测算法
2
基于Java的大语言模型动态适配方法及系统
大语言模型 动态适配方法 分块 适配器 支持混合索引
3
一种少样本多维时间序列异常检测方法、系统、设备及介质
频域特征 序列 时域特征 预训练语言模型 重构模型
4
气液界面识别与船舶晃荡液位修正方法和系统
轻量卷积神经网络 修正方法 时序预测模型 灰度纹理特征 修正液
5
一种基于信息增强型多模态大模型的分子逆合成方法
多模态 分子 信息处理模型 微调技术 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号