多模态感知的智能麦克风阵列信号处理方法与系统

正文

推荐专利

申请号：CN202511337012

申请日期：2025-09-18

公开号：CN120808810B

公开日期：2025-11-21

类型：发明专利

摘要

本发明提供多模态感知的智能麦克风阵列信号处理方法与系统，属于信号处理技术领域，包括：采用多方位视觉传感器获取视觉信号和采用麦克风阵列获取声音信号；提取视觉特征和声学特征；构建视听拓扑特征空间，将视觉特征和声学特征映射至此空间，建立声源概率分布模型；采用多维判别对抗生成网络处理声音信号，分离出目标语音信号；实时评估声学环境状态，动态调整处理参数；对分离出的多路目标语音信号进行质量评估，选择最高质量的语音信号作为输出，视听多模态信息深度融合与协同处理，结合拓扑增强型对抗生成网络架构和环境自适应机制，显著提升了复杂环境下的语音分离效果，在6人同时说话场景下仍能保持85%以上的语音可懂度。

技术关键词

阵列信号处理方法智能麦克风声学特征视觉特征拓扑特征视觉传感器多模态语音视听阵列信号处理系统唇形特征优化特征距离全景视觉信息多方位麦克风阵列采集声纹特征背景噪声水平

系统为您推荐了相关专利信息

一种基于场景图的图像文本检索方法与系统

场景文本检索方法融合特征视觉特征对象

视频检索方法、装置及计算机设备

视频检索方法器械分段编码向量视频帧

基于数字孪生与视觉交互的电商虚拟场景生成方法及系统

虚拟场景生成方法环境光照条件数字孪生电商坐标

基于视觉语言实例融合的细粒度遥感目标检测方法及装置

遥感图像特征嵌入特征检测网络模型语言编码器检测头

一种基于AI的艺术广告自动设计方法及系统

语义相关度自动设计方法基因有效性邻域

多模态感知的智能麦克风阵列信号处理方法与系统

站点导航

APP 下载