基于双层模型的环境易混声识别方法、系统及存储介质

AITNT
正文
推荐专利
基于双层模型的环境易混声识别方法、系统及存储介质
申请号:CN202510853230
申请日期:2025-06-24
公开号:CN120708646A
公开日期:2025-09-26
类型:发明专利
摘要
本发明公开了一种基于双层模型的环境易混声识别方法、系统及存储介质,方法包括通过带有时间窗口傅里叶变换将音频时间序列转换为频谱图;通过人工智能模型提取频谱图中的图像特征并识别出声源类别,若声源类别为不易混淆声源,则直接输出声源识别结果,若声源类别为易混淆声源,则将对应的频谱图输入至易混淆声源识别模型进行识别,其中,所述易混淆声源识别模型与所述人工智能模型的区别在于仅使用易混淆声源进行训练和识别。本发明方法提高了当前环境声源识别的准确度。
技术关键词
人工智能模型 窗口傅里叶变换 识别方法 残差神经网络 注意力编码器 编码器模块 滑动时间窗口 序列 机械振动信号 线性变换矩阵 多头注意力机制 音频采集器 处理器 识别系统 时间域 传声器 平方根
系统为您推荐了相关专利信息
1
一种热物性参数识别方法、系统、介质及设备
热物性参数 参数识别方法 物性测量方法 小区间 拟合算法
2
融合多模态特征的双塔实体识别方法、装置、设备及介质
融合多模态特征 视觉感知特征 实体识别方法 融合特征 图像
3
一种基于SVM的无人机群与鸟群分类识别方法、系统及介质
分类识别方法 回波模型 旋翼叶片 无人机旋翼 鸟群识别
4
基于多维数据时空演化树模型的冬小麦播种进度及季中作物高精度识别方法
高精度识别方法 冬季作物 智能识别算法 指标 遥感时序数据
5
一种面向自动驾驶仿真的三维场景可控生成方法和系统
三维模型 建筑物 场景 结点 编码向量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号