摘要
本申请公开了一种声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备,其中,该声场景分类模型生成方法包括从声场景分类数据集中随机选取源音频和目标音频;根据源语音和目标语音生成源梅尔频谱图和目标梅尔频谱图;根据目标梅尔频谱图生成随机掩码图,并获取随机掩码图的倒转随机掩码图;基于随机掩码图、倒转随机掩码、源梅尔频谱图和目标梅尔频谱图生成增强频谱图和标签;基于增强频谱图和标签对预设神经网络进行训练,生成声场景分类模型。本方案可以提高声场景分类结果的准确性。
技术关键词
模型生成方法
声场景分类方法
音频
生成随机
语音
生成标签
模型生成装置
电子设备
处理器
存储器
滤波器
数据
指令
系统为您推荐了相关专利信息
音频信号预处理
检索方法
噪声过滤技术
背景噪声干扰
建立特征数据库
显控台
传感器单元
数字孪生
手势识别模块
语音识别模块
检索算法
音乐特征提取
数据
推荐方法
计算机可执行指令
智能语音分析
业务推荐方法
关键词
业务推荐系统
电信