语音识别方法、装置、电子设备以及存储介质

AITNT
正文
推荐专利
语音识别方法、装置、电子设备以及存储介质
申请号:CN202411576253
申请日期:2024-11-06
公开号:CN119600995A
公开日期:2025-03-11
类型:发明专利
摘要
本公开提供了一种语音识别方法、装置、电子设备以及存储介质,涉及语音识别技术领域,该方法包括:获取至少一个样本语音和样本语音对应的标准语音文本;对样本语音进行语音特征提取,得到样本语音特征;将样本语音特征输入训练完成的声学模型,得到训练完成的声学模型输出的声学建模特征;将声学建模特征和标准语音文本输入大语言模型,得到大语言模型输出的预测概率分布和预测语音文本,预测概率分布用于指示样本语音对应预测词语的概率分布;基于预测概率分布、预测语音文本和标准语音文本,训练大语言模型,以使训练完成的大语言模型和训练完成的声学模型具备语音识别功能。该方法可以提高语音识别准确率。
技术关键词
大语言模型 文本 语音特征提取 语音识别方法 样本 语音识别功能 语音识别准确率 词语 语音识别装置 语音识别技术 语音识别模块 电子设备 字预测 特征提取模块 计算机 网络 标签 处理器
系统为您推荐了相关专利信息
1
一种基于RPA的数字化办公方法、装置、设备及介质
办公方法 分割图像数据 序列 表达式 校验终端
2
脊柱疾病诊断用多模态大语言模型的评测方法及系统
大语言模型 评测方法 基准 多模态 定位问题
3
电力设备视觉大模型构建、训练、评估方法及系统
电力巡检图像 样本 输出特征 生成电力 双分支结构
4
三维运动检索方法、装置、电子设备及存储介质
运动检索方法 文本 运动特征 旋转特征 样本
5
一种智能体驱动的三维视频生成的方法和系统
控制智能体 动态场景 三维视频生成方法 处理单元 三维运动参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号