一种基于蒸馏的持续自监督多类型语音声学特征表示方法

正文

推荐专利

申请号：CN202510054722

申请日期：2025-01-14

公开号：CN119832940B

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及深度学习技术领域，具体为一种基于蒸馏的持续自监督多类型语音声学特征表示方法，包括：语音数据的采集；对采集的语音数据进行预处理，并将预处理后的不同类型语音数据分配到不同训练阶段；初始化一个掩蔽自监督特征提取模型；根据模型输出的重构特征构建重演缓冲区并进行数据增强；在下一阶段更新掩蔽自监督特征提取模型，利用重演缓冲区进行特征蒸馏；得到拟提取的多类型语音的声学特征；该方法将多类型语音数据按序训练，能够防止不同数据发生数据冲突；其次，在重演缓冲区数据上利用余弦相似度作为正则项进行特征蒸馏来保留知识，可在防止旧知识遗忘的同时，增强模型的可塑性。

技术关键词

谱图特征语音声学特征特征提取模型语音特征提取蒸馏阶段数据重构样本模型训练模块更新模型参数深度学习技术频谱特征处理器语谱图序列

系统为您推荐了相关专利信息

基于阶跃流式残差链接层网的港机卷扬模块健康状态评估方法

健康状态评估方法模块时序振动传感器布置蒸馏

一种基于人工智能的历史交互信息处理方法

交互信息处理方法特征提取模型深度学习模型双向注意力机制客服

一种基于云边协同的工业异常检测方法及装置

异常检测方法参数轻量级卷积神经网络云端标签

基于盲道场景数据蒸馏的多模态端侧导盲大模型训练方法

模型训练方法盲道蒸馏场景数据

基于自监督学习的声音异常检测方法、装置、设备及介质

声波特征声音异常检测特征提取模型样本编码向量

一种基于蒸馏的持续自监督多类型语音声学特征表示方法

站点导航

APP 下载