语音表征模型预训练方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410947093

申请日期：2024-07-15

公开号：CN118737129B

公开日期：2025-12-09

类型：发明专利

摘要

本公开关于语音表征模型预训练方法、装置、电子设备及存储介质，该方法包括：随机初始化映射矩阵和码本集合，基于映射矩阵对样本语音的音频帧序列中各音频帧分别进行向量映射处理得到各音频帧的映射向量；从码本集合中搜索与各映射向量相匹配的目标码本向量并将其目标索引作为相应音频帧的参考离散化标签；将经遮蔽的音频帧序列输入待训练语音表征模型进行语音表征处理得到语音表征结果；对语音表征结果中对应各被遮蔽位置的表征结果分别进行离散化标签预测；基于各被遮蔽位置对应的预测离散化标签与相应参考离散化标签之间的差异，调整待训练语音表征模型的模型参数以得到预训练的语音表征模型。本公开提高了语音表征模型的预训练速度和稳定性。

技术关键词

序列信息熵语音音频预训练方法标签索引矩阵电子设备模型预训练处理器可读存储介质规模计算机程序产品样本频域特征参数指令关系

系统为您推荐了相关专利信息

一种煤炭焦渣样本分类检测方法及系统

分类检测方法波长噪声指数光度样本

面向高压断路器非拆解检测弹簧形变-模态评测健康状态的方法

滤波算法滤波器分解算法高压断路器弹簧曲线

基于态势感知的电网风险评估方法及系统

电网历史状态数据电网风险评估方法电网运行风险评估预测特征指数平滑模型

一种基于物联网的设备故障预警系统及方法

设备故障预警系统机械运行参数设备故障预警方法设备运行状态通信网络

一种任务处理方法、装置、电子设备及存储介质

意图语音规划车辆智能控制计算机

语音表征模型预训练方法、装置、电子设备及存储介质

站点导航

APP 下载