基于特征解耦和多任务学习的跨域语音分类方法及装置

AITNT
正文
推荐专利
基于特征解耦和多任务学习的跨域语音分类方法及装置
申请号:CN202510830708
申请日期:2025-06-20
公开号:CN120452429A
公开日期:2025-08-08
类型:发明专利
摘要
本申请涉及一种基于特征解耦和多任务学习的跨域语音分类方法及装置。所述方法包括:首先,获取多数据域语音文件,并进行预处理,得到跨域语音分类数据集;之后,构建跨域语音分类模型,包括语音特征编码器模块、数据域分类模块、监督对比学习模块和多任务分类模块;之后,基于数据域分类损失、监督对比学习损失以及任务分类损失构建联合优化损失函数,基于所述跨域语音分类数据集和联合优化损失函数采用梯度下降算法训练优化所述跨域语音分类模型;最后,将待分类语音输入训练后的跨域语音分类模型,得到语音对应类别。显著提升了模型在跨域场景下的判别能力与泛化能力,使模型在复杂多源语音环境中依然保持较高的分类精度。
技术关键词
语音分类模型 语音分类方法 多任务分类 编码器模块 梯度下降算法 语音特征 数据 加载器 特征提取模块 分类装置 处理器 样本 计算机设备 可读存储介质 存储器 标签 注意力
系统为您推荐了相关专利信息
1
一种基于边缘计算的注吹中空成型方法
中空成型方法 注吹中空成型机 综合边缘 空洞 生成制品
2
面向新能源场景不确定性的多级限额切换优化方法
切换优化方法 分布鲁棒优化 同步发电机 机组组合模型 预测误差
3
一种基于空天地一体化的城乡温室气体排放模拟方法、模拟器、终端及可读存储介质
减排策略 空天地一体化 气体排放 反演模型 模拟器
4
一种针对多体系储能电池多场景状态监测的模型构建方法
电池故障诊断 历史故障数据 模型构建方法 储能电池 多场景
5
基于多模态和音频驱动的数字人构建方法
音唇同步 音频特征 视频帧 人脸特征 音频编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号