会议语音识别方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510686745

申请日期：2025-05-26

公开号：CN120472883A

公开日期：2025-08-12

类型：发明专利

摘要

本申请公开了一种会议语音识别方法、装置、电子设备，属于语音识别技术领域。所述方法包括：对多个拾音设备采集的会议音频进行会议场景一致性判断，获取会议音频中匹配目标会议场景的会议音频；对匹配目标会议场景的会议音频进行分段筛选及多设备拼接处理，获取目标会议场景的拼接音频；对目标会议场景的预先采集的视觉信息和拼接音频进行多模态信息融合，获取多模态融合信息；基于多模态融合信息进行语音识别，得到目标会议场景的会议语音识别结果。本方法利用多拾音设备协同采集单一会议场景的会议音频，确保得到的高质量语音信号；通过在音频信号中融合多模态信息进行语音识别，全面捕捉和处理多种数据，提高了语音识别的准确度和鲁棒性。

技术关键词

会议场景音频多模态信息融合拾音设备语音识别方法融合多模态信息分段语音识别装置语音识别技术语音识别模块视觉电子设备神经网络模型处理器视频背景噪声多设备

系统为您推荐了相关专利信息

一种用于抑郁症检测的音视频融合多模态评估方法

音视频交互音频特征多模态多层感知机全局平均池化

音频识别方法和装置、系统、存储介质

音频识别方法听觉人工神经网络线性分类器音频信号处理技术

一种基于多模态感知的光伏储能设备安全预警方法

光伏储能设备频谱特征故障风险评估独立成分分析算法短时傅里叶变换

一种语音通话实时转写系统及方法

数据多模态特征音频动态资源分配矢量量化算法

一种基于多数据源的公共数据平台检索方法及系统

识别标签文本检索方法检索系统矩阵

会议语音识别方法、装置、电子设备及存储介质

站点导航

APP 下载