语音表征模型预训练方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
语音表征模型预训练方法、装置、电子设备及存储介质
申请号:CN202410947093
申请日期:2024-07-15
公开号:CN118737129B
公开日期:2025-12-09
类型:发明专利
摘要
本公开关于语音表征模型预训练方法、装置、电子设备及存储介质,该方法包括:随机初始化映射矩阵和码本集合,基于映射矩阵对样本语音的音频帧序列中各音频帧分别进行向量映射处理得到各音频帧的映射向量;从码本集合中搜索与各映射向量相匹配的目标码本向量并将其目标索引作为相应音频帧的参考离散化标签;将经遮蔽的音频帧序列输入待训练语音表征模型进行语音表征处理得到语音表征结果;对语音表征结果中对应各被遮蔽位置的表征结果分别进行离散化标签预测;基于各被遮蔽位置对应的预测离散化标签与相应参考离散化标签之间的差异,调整待训练语音表征模型的模型参数以得到预训练的语音表征模型。本公开提高了语音表征模型的预训练速度和稳定性。
技术关键词
序列 信息熵 语音 音频 预训练方法 标签 索引 矩阵 电子设备 模型预训练 处理器 可读存储介质 规模 计算机程序产品 样本 频域特征 参数 指令 关系
系统为您推荐了相关专利信息
1
一种煤炭焦渣样本分类检测方法及系统
分类检测方法 波长 噪声指数 光度 样本
2
面向高压断路器非拆解检测弹簧形变-模态评测健康状态的方法
滤波算法 滤波器 分解算法 高压断路器弹簧 曲线
3
基于态势感知的电网风险评估方法及系统
电网历史状态数据 电网风险评估方法 电网运行风险评估 预测特征 指数平滑模型
4
一种基于物联网的设备故障预警系统及方法
设备故障预警系统 机械运行参数 设备故障预警方法 设备运行状态 通信网络
5
一种任务处理方法、装置、电子设备及存储介质
意图 语音 规划 车辆智能控制 计算机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号