语音识别模型训练方法、语音识别方法、装置和存储介质

AITNT
正文
推荐专利
语音识别模型训练方法、语音识别方法、装置和存储介质
申请号:CN202410977647
申请日期:2024-07-19
公开号:CN118711573B
公开日期:2025-08-29
类型:发明专利
摘要
本公开涉及一种语音识别模型训练方法、语音识别方法、装置和存储介质。该方法包括:获取训练音频;根据训练音频的声学信息和语义信息,确定训练音频的第一目标伪标签,第一目标伪标签指示训练音频对应的目标文本;基于训练音频和第一目标伪标签训练初始语音识别模型,得到训练后的语音识别模型。根据本公开实施例,通过获取未标注的训练音频,根据训练音频的声学信息和语义信息,确定训练音频的第一目标伪标签,可以挑选出语义更合理和更有训练价值的标签,从而基于训练音频和第一目标伪标签训练初始语音识别模型,得到训练后的语音识别模型,可以在节约标注成本的同时,提升模型训练和语音识别的效果,得到精度更高的语音识别模型。
技术关键词
语音识别模型 标签 音频 大语言模型 语音识别方法 非易失性计算机可读存储介质 语义 计算机程序指令 文本 拼音 序列 语音识别装置 命名实体识别 处理器 场景 训练装置 模块 存储器
系统为您推荐了相关专利信息
1
一种预测断奶仔猪腹泻风险等级的方法
断奶仔猪腹泻 机器学习模型 风险 数据 梯度下降法
2
基于几何迭代优化融合的多序列影像分割方法
影像分割方法 迭代优化算法 构建序列影像 图像像素 标签
3
一种基于大语言模型的中药问答方法、装置、设备及介质
大语言模型 问答方法 无监督 中药 文本
4
一种基于大模型有监督微调的转子打滑根因溯源调控方法
调控方法 工况参数 适配器技术 转子 措施
5
一种家畜识别方法、装置、电子设备及存储介质
家畜 模态特征 数据 融合特征 识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号