声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备

正文

推荐专利

申请号：CN202410848719

申请日期：2024-06-27

公开号：CN118658464B

公开日期：2025-11-18

类型：发明专利

摘要

本申请公开了一种声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备，其中，该声场景分类模型生成方法包括从声场景分类数据集中随机选取源音频和目标音频；根据源语音和目标语音生成源梅尔频谱图和目标梅尔频谱图；根据目标梅尔频谱图生成随机掩码图，并获取随机掩码图的倒转随机掩码图；基于随机掩码图、倒转随机掩码、源梅尔频谱图和目标梅尔频谱图生成增强频谱图和标签；基于增强频谱图和标签对预设神经网络进行训练，生成声场景分类模型。本方案可以提高声场景分类结果的准确性。

技术关键词

模型生成方法声场景分类方法音频生成随机语音生成标签模型生成装置电子设备处理器存储器滤波器数据指令

系统为您推荐了相关专利信息

一种开放手术中的电刀固定与电刀头清洁装置

刀头清洁装置开放手术电刀调节轴硅胶保护

一种人耳感知频率特征码检索方法

音频信号预处理检索方法噪声过滤技术背景噪声干扰建立特征数据库

一种搭载VR眼镜的集成舰船显控台

显控台传感器单元数字孪生手势识别模块语音识别模块

歌曲的推荐方法、装置、电子设备及存储介质

检索算法音乐特征提取数据推荐方法计算机可执行指令

一种基于智能语音分析的电信客服业务推荐方法及系统

智能语音分析业务推荐方法关键词业务推荐系统电信

声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备

站点导航

APP 下载