摘要
本发明实施例公开了一种银行柜台对讲降噪方法、装置、电子设备及存储介质。该方法包括:获取客户端的视频信息以及音频信息;所述视频信息以及音频信息由设置在柜台上内置麦克风的目标摄像头获取;将所述视频信息以及音频信息进行特征提取,并将提取的音频特征以及视频特征进行交叉注意力特征融合,得到试听动作特征;确定包含上下文信息的目标音频特征,并将所述目标音频特征与视听动作特征输入至跨上下文注意力特征融合模块进行降噪处理,得到目标音频。采用本发明实施例的技术方案,通过基于音视协同的语音降噪算法去过滤环境噪音以及其他客户声音,提高柜员办理业务的效率,增加用户的客户旅程体验。
技术关键词
音频特征
动作特征
银行柜台
注意力
时序特征
降噪方法
线性
计算机可执行指令
语音降噪算法
梅尔倒谱系数
视听
掩膜
音视频
麦克风
音频编码器
客户端
电子设备
系统为您推荐了相关专利信息
动作控制方法
融合特征
多模态
动作控制程序
序列
转子故障诊断
多模态数据融合
时域特征提取
故障诊断模块
特征提取模块
现场管理方法
公路施工现场
大数据分析技术
关系型数据库
构建机器学习模型
障碍识别系统
融合特征
时序
动态特征提取
集成算法