基于特征解耦和多任务学习的跨域语音分类方法及装置

正文

推荐专利

申请号：CN202510830708

申请日期：2025-06-20

公开号：CN120452429A

公开日期：2025-08-08

类型：发明专利

摘要

本申请涉及一种基于特征解耦和多任务学习的跨域语音分类方法及装置。所述方法包括：首先，获取多数据域语音文件，并进行预处理，得到跨域语音分类数据集；之后，构建跨域语音分类模型，包括语音特征编码器模块、数据域分类模块、监督对比学习模块和多任务分类模块；之后，基于数据域分类损失、监督对比学习损失以及任务分类损失构建联合优化损失函数，基于所述跨域语音分类数据集和联合优化损失函数采用梯度下降算法训练优化所述跨域语音分类模型；最后，将待分类语音输入训练后的跨域语音分类模型，得到语音对应类别。显著提升了模型在跨域场景下的判别能力与泛化能力，使模型在复杂多源语音环境中依然保持较高的分类精度。

技术关键词

语音分类模型语音分类方法多任务分类编码器模块梯度下降算法语音特征数据加载器特征提取模块分类装置处理器样本计算机设备可读存储介质存储器标签注意力

系统为您推荐了相关专利信息

一种基于边缘计算的注吹中空成型方法

中空成型方法注吹中空成型机综合边缘空洞生成制品

面向新能源场景不确定性的多级限额切换优化方法

切换优化方法分布鲁棒优化同步发电机机组组合模型预测误差

一种基于空天地一体化的城乡温室气体排放模拟方法、模拟器、终端及可读存储介质

减排策略空天地一体化气体排放反演模型模拟器

一种针对多体系储能电池多场景状态监测的模型构建方法

电池故障诊断历史故障数据模型构建方法储能电池多场景

基于多模态和音频驱动的数字人构建方法

音唇同步音频特征视频帧人脸特征音频编码器

基于特征解耦和多任务学习的跨域语音分类方法及装置

站点导航

APP 下载