基于双层模型的环境易混声识别方法、系统及存储介质

正文

推荐专利

申请号：CN202510853230

申请日期：2025-06-24

公开号：CN120708646A

公开日期：2025-09-26

类型：发明专利

摘要

本发明公开了一种基于双层模型的环境易混声识别方法、系统及存储介质，方法包括通过带有时间窗口傅里叶变换将音频时间序列转换为频谱图；通过人工智能模型提取频谱图中的图像特征并识别出声源类别，若声源类别为不易混淆声源，则直接输出声源识别结果，若声源类别为易混淆声源，则将对应的频谱图输入至易混淆声源识别模型进行识别，其中，所述易混淆声源识别模型与所述人工智能模型的区别在于仅使用易混淆声源进行训练和识别。本发明方法提高了当前环境声源识别的准确度。

技术关键词

人工智能模型窗口傅里叶变换识别方法残差神经网络注意力编码器编码器模块滑动时间窗口序列机械振动信号线性变换矩阵多头注意力机制音频采集器处理器识别系统时间域传声器平方根

系统为您推荐了相关专利信息

一种热物性参数识别方法、系统、介质及设备

热物性参数参数识别方法物性测量方法小区间拟合算法

融合多模态特征的双塔实体识别方法、装置、设备及介质

融合多模态特征视觉感知特征实体识别方法融合特征图像

一种基于SVM的无人机群与鸟群分类识别方法、系统及介质

分类识别方法回波模型旋翼叶片无人机旋翼鸟群识别

基于多维数据时空演化树模型的冬小麦播种进度及季中作物高精度识别方法

高精度识别方法冬季作物智能识别算法指标遥感时序数据

一种面向自动驾驶仿真的三维场景可控生成方法和系统

三维模型建筑物场景结点编码向量

基于双层模型的环境易混声识别方法、系统及存储介质

站点导航

APP 下载