基于元数据增强的语音识别模型预训练方法、语音识别方法及系统

AITNT
正文
推荐专利
基于元数据增强的语音识别模型预训练方法、语音识别方法及系统
申请号:CN202510356445
申请日期:2025-03-25
公开号:CN120260548A
公开日期:2025-07-04
类型:发明专利
摘要
本发明涉及语音识别技术,提供一种基于元数据增强的语音识别模型预训练方法、语音识别方法及系统。其中语音识别模型预训练方法包括:获取语音识别数据集,所述语音识别数据集由不同语种的语音‑文本对组成,从所述语音识别数据集中N种语种中采样N个任务以形成批次数据集,将所述批次数据集中的每个任务分为支持集和查询集;基于所述批次数据集对语音识别模型进行元训练,提取训练过程中在所述语音识别模型的指定隐藏层中的批次数据集并进行数据扰动,得到扰动数据集;对应的,所述扰动数据集中每个任务包含扰动支持集和扰动查询集;将所述批次数据集和所述扰动数据集进行混合增强后对每个语种进行训练并更新所述语音识别模型参数。
技术关键词
语音识别模型 预训练方法 数据 编码器适配器 语音识别方法 文本 语音特征 参数 语音识别系统 语音识别技术 语音识别模块 模型训练模块 样本 处理器 存储器 非线性 电子设备
系统为您推荐了相关专利信息
1
芯片、数据缓冲电路及其控制方法
缓冲电路 闪存阵列 写入驱动器 灵敏放大器 译码
2
内容推荐模型训练方法、内容推荐方法、装置和电子设备
内容推荐模型 样本 集群 内容推荐方法 账户
3
一种太阳能网板的分区划分方法、终端、介质及产品
分区划分方法 图形处理 标识 计算机程序代码 激光
4
一种海洋环境钢结构涂层防腐性能测试分析方法
性能测试分析方法 涂层 性能测试数据 钢结构 海洋环境数据
5
一种在车辆行驶过程中预测违章风险的方法
决策树模型 CART决策树 车辆 风险 机器学习训练
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号