音频信号处理方法及装置

正文

推荐专利

音频信号处理方法及装置

申请号：CN202410880945

申请日期：2024-07-02

公开号：CN118711617A

公开日期：2024-09-27

类型：发明专利

摘要

本申请提供了一种音频信号处理方法及装置，该方法包括：从摄像头实时获取音视频信号，其中，音视频信号包括音频信号和视频信号，视频信号的至少部分视频帧中包括目标对象；基于至少部分视频帧识别目标对象的图像语义特征，基于图像语义特征和音频信号中与至少部分视频帧对应的音频来识别目标对象在与至少部分视频帧对应的音频中的目标声音,其中，图像语义特征是目标对象发声时的面部表征；从目标声音中提取声纹特征，并基于声纹特征来增强音频信号，得到增强后的音频信号。本申请解决了现有技术中在直播时可能由于背景噪声的影响而导致声音清晰度不高的技术问题。

技术关键词

语义特征声纹特征视频帧深度音频特征音频信号处理方法对象面部音视频图像音频信号处理装置语音旋转角识别模块存储计算机程序发声降噪算法信噪比

系统为您推荐了相关专利信息

一种具有预测功能的输电线路巡检方法、设备及介质

输电线路巡检方法伸展机械臂距离图像时间段输电线路巡检设备

交互方法、第一电子设备和第二电子设备

电子设备交互方法传感器信号音频

控制指令响应方法、装置、机器人和存储介质

机器人模型大语言模型答案文本音频

基于多模态信息交互人脸合成方法、装置及设备

语义特征音频面部特征时序特征多模态信息

基于主体与场景语义提示的无参考水下图像质量评价方法

视觉特征提取水下图像数据文本图像视觉特征多尺度池化

音频信号处理方法及装置

站点导航

APP 下载