声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备

AITNT
正文
推荐专利
声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备
申请号:CN202410848719
申请日期:2024-06-27
公开号:CN118658464B
公开日期:2025-11-18
类型:发明专利
摘要
本申请公开了一种声场景分类模型生成方法、声场景分类方法、装置、存储介质及电子设备,其中,该声场景分类模型生成方法包括从声场景分类数据集中随机选取源音频和目标音频;根据源语音和目标语音生成源梅尔频谱图和目标梅尔频谱图;根据目标梅尔频谱图生成随机掩码图,并获取随机掩码图的倒转随机掩码图;基于随机掩码图、倒转随机掩码、源梅尔频谱图和目标梅尔频谱图生成增强频谱图和标签;基于增强频谱图和标签对预设神经网络进行训练,生成声场景分类模型。本方案可以提高声场景分类结果的准确性。
技术关键词
模型生成方法 声场景分类方法 音频 生成随机 语音 生成标签 模型生成装置 电子设备 处理器 存储器 滤波器 数据 指令
系统为您推荐了相关专利信息
1
一种开放手术中的电刀固定与电刀头清洁装置
刀头清洁装置 开放手术 电刀 调节轴 硅胶保护
2
一种人耳感知频率特征码检索方法
音频信号预处理 检索方法 噪声过滤技术 背景噪声干扰 建立特征数据库
3
一种搭载VR眼镜的集成舰船显控台
显控台 传感器单元 数字孪生 手势识别模块 语音识别模块
4
歌曲的推荐方法、装置、电子设备及存储介质
检索算法 音乐特征提取 数据 推荐方法 计算机可执行指令
5
一种基于智能语音分析的电信客服业务推荐方法及系统
智能语音分析 业务推荐方法 关键词 业务推荐系统 电信
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号