摘要
本申请公开了一种多声源波达方向估计模型的训练方法、多声源波达方向估计方法、设备、介质及产品,涉及信号处理与人工智能交叉技术领域,训练方法包括:计算多通道阵列原始信号的时频特征和互相关特征;对时频特征和麦克风位置信息分别进行位置编码;再将这些特征融合为输入矩阵输入改进Transformer模型的主干网络;利用第一多头自注意力层,计算输入矩阵的注意力得分并生成头输出,再将头输出输入第二多头自注意力层,计算注意力得分并生成头输出,再将输出输入多任务输出模块,得到方向估计结果。本申请引入多头注意力机制,捕捉长时间、多频段之间的复杂依赖,提升声源区分能力,多个头从不同视角捕捉方向信息,保证在复杂环境下仍能保证高精确度。
技术关键词
多声源
编码特征
估计方法
多通道
矩阵
时间域
人工智能交叉技术
输出模块
多任务
麦克风
编码模块
池化特征
预测特征
阵列
多头注意力机制
信号
离散小波变换
编码器
系统为您推荐了相关专利信息
水质预测方法
长短期记忆网络
处理单元
生物
药剂投加量
关键点
检测模型训练方法
手部检测方法
图像
坐标
海洋牧场
高光谱图像数据
矩阵
数据通信接口
运动控制模块