摘要
本申请提供了一种音频获取方法、装置、存储介质及设备,该方法应用于电子设备领域,该方法从用户在应用场景中的目标音频数据中获取目标音频特征,目标音频特征中包括噪声特征和用户的用户音频特征,以预先生成的用户的参考声纹向量为参考,从目标音频中获取用户音频特征,进而基于用户音频特征获取用户音频数据。其中,参考声纹向量为在预先采集的用户的注册音频数据集合中提取的共性表征的融合声纹向量,提高了声纹向量的表征能力,进而提升了音频获取过程中的降噪效果。
技术关键词
音频特征
掩码矩阵
仿真数据
音频获取方法
面部图像数据
交叉注意力机制
计算机程序代码
神经网络模型
可执行程序代码
噪声数据
音频获取装置
声纹特征
场景
电子设备
人声
可读存储介质
噪声特征
系统为您推荐了相关专利信息
仿真数据
仿真模型
灰色关联分析
置信度评估方法
灰色关联度
音频特征
分拣机器人
建筑垃圾资源化
音频采集设备
智能分拣方法
语音识别网络
语音特征
文本
计算机可执行指令
样本
深度音频特征
融合多源特征
声学特征
多尺度
多层次
视觉融合方法
模态特征
全景视频
嵌入特征
交叉注意力机制