摘要
本发明涉及语音识别技术领域,具体涉及一种多人会议场景下的话筒语音采集方法,包括:获取多人会议场景中任一话筒捕捉的声源音频并进行预处理得到待分析的声源数据;分离为多个原始分量信号,分析原始分量信号为主要信号的可能性得到主要信号组,基于目标分析信号计算主要发言分量的可能性指数,得到目标分析信号为主要发言人的话筒对应的主要分量信息的可能性;进而得到目标分析信号为主要发言人的话筒对应的主要分量信息的终级可能性;基于主要发言人的话筒对应的主要分量信息的终级可能性确定调整因子,通过调整因子加权重构每一对应信号;结合重构后的信号计算任一话筒的信号强度,通过信号强度获取对应话筒重构后的音频信息。
技术关键词
多人会议场景
语音采集方法
话筒
信号
发言人
重构
指数
因子
频率
音频
动态时间规整
语音识别技术
幅值
阶段
噪声源
数据
电压
数值