基于发音信息引导的混合语音识别模型训练方法和基于发音信息引导的混合语音识别方法

正文

推荐专利

申请号：CN202510851404

申请日期：2025-06-24

公开号：CN120636373A

公开日期：2025-09-12

类型：发明专利

摘要

本申请提供了一种基于发音信息引导的混合语音识别模型训练方法和基于发音信息引导的混合语音识别方法，包括：获取混合语音样本和混合语音样本的标签信息，混合语音样本的语言种类至少包括第一语言和第二语言，标签信息至少包括第一语言对应的第一文本、第一文本对应的发音、第二语言对应的第二文本、第二文本对应的发音；将混合语音样本输入到语音识别模型中，通过语音识别模型识别混合语音样本的预测结果，预测结果至少包括第一语言对应的第一预测文本、第一预测文本的第一预测发音、第二语言对应的第二预测文本和第二预测文本的第二预测发音；根据预测结果和标签信息，调整语音识别模型的参数。如此，能够精准识别混合语音的文本。

技术关键词

语音识别模型混合语音识别方法发音文本模型训练方法声学特征样本大语言模型解码器标签嵌入特征投影器模型训练装置校正采样器分析模块序列参数

系统为您推荐了相关专利信息

一种跨模态交互补全的航空安全事件识别方法

变分自动编码器图像解码器文本编码器图像编码器样本

一种基于影像报告的异常疾病标签标注系统和方法

神经网络分类标签标注方法标注系统报告影像

一种建筑图像的生成方法、设备及介质

生成方法版图编码特征文本建筑

一种基于机器学习的金融交易风险评估方法、设备及介质

金融交易风险指标文本数据情绪特征

一种儿童骨龄图像采集定位装置及其检测方法

图像采集检测方法图像采集定位装置儿童关键词年龄

基于发音信息引导的混合语音识别模型训练方法和基于发音信息引导的混合语音识别方法

站点导航

APP 下载