音频信号处理方法及装置

AITNT
正文
推荐专利
音频信号处理方法及装置
申请号:CN202410880945
申请日期:2024-07-02
公开号:CN118711617A
公开日期:2024-09-27
类型:发明专利
摘要
本申请提供了一种音频信号处理方法及装置,该方法包括:从摄像头实时获取音视频信号,其中,音视频信号包括音频信号和视频信号,视频信号的至少部分视频帧中包括目标对象;基于至少部分视频帧识别目标对象的图像语义特征,基于图像语义特征和音频信号中与至少部分视频帧对应的音频来识别目标对象在与至少部分视频帧对应的音频中的目标声音,其中,图像语义特征是目标对象发声时的面部表征;从目标声音中提取声纹特征,并基于声纹特征来增强音频信号,得到增强后的音频信号。本申请解决了现有技术中在直播时可能由于背景噪声的影响而导致声音清晰度不高的技术问题。
技术关键词
语义特征 声纹特征 视频帧 深度音频特征 音频信号处理方法 对象 面部 音视频 图像 音频信号处理装置 语音 旋转角 识别模块 存储计算机程序 发声 降噪算法 信噪比
系统为您推荐了相关专利信息
1
一种具有预测功能的输电线路巡检方法、设备及介质
输电线路巡检方法 伸展机械臂 距离图像 时间段 输电线路巡检设备
2
交互方法、第一电子设备和第二电子设备
电子设备 交互方法 传感器 信号 音频
3
控制指令响应方法、装置、机器人和存储介质
机器人模型 大语言模型 答案 文本 音频
4
基于多模态信息交互人脸合成方法、装置及设备
语义特征 音频 面部特征 时序特征 多模态信息
5
基于主体与场景语义提示的无参考水下图像质量评价方法
视觉特征提取 水下图像数据 文本 图像视觉特征 多尺度池化
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号