多人声源分离方法、装置、设备、介质和计算机程序产品

AITNT
正文
推荐专利
多人声源分离方法、装置、设备、介质和计算机程序产品
申请号:CN202510238450
申请日期:2025-03-03
公开号:CN119741938A
公开日期:2025-04-01
类型:发明专利
摘要
本发明提供一种多人声源分离方法、装置、设备、介质和计算机程序产品,涉及音频信号处理技术领域。该方法包括:获取包含多人语音的语音片段;基于各个麦克风单元的物理位置,利用ODAS算法确定各个声源的方位角;根据各个声源的方位角,确定各个声源的标识符;基于各个声源的标识符,从语音片段中读取各标识符对应的语音片段分段;将属于同一标识符的语音片段分段作为与同一标识符对应的说话人的独立语音段。该方法不需要事先训练好的人工智能模型,不需要预先标注大量声纹数据,根据麦克风阵列采集到的不同声源的方位角即可分离出不同说话人的独立语音片段,在保证了语音识别准确性的同时,降低了计算资源,从而降低了成本。
技术关键词
麦克风单元 标识符 人声 方位角 分段 计算机程序产品 音频信号处理技术 语音识别准确性 语音降噪算法 非暂态计算机可读存储介质 麦克风阵列采集 声学特征 物理 人工智能模型 处理器 时间差 波束成形
系统为您推荐了相关专利信息
1
一种图文互动的思维机控制系统及方法
上下文标识符 机控制方法 分布式会话 多模态协同 资源池管理
2
一种智慧园区的能耗数据实时监测方法
数据实时监测方法 能耗 分段 电力 ARIMA模型
3
装置、系统、含芯片产品和非暂态计算机可读介质
延迟电路系统 检测电路系统 指令 数据执行数据处理 标识符
4
3D虚拟数字人的交互系统及方法
交互方法 意图 随机森林模型 输入设备 样本
5
一种任务调度方法和装置
任务调度算法 任务调度方法 任务调度装置 分段 动态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号