摘要
本发明属于语音识别技术领域,公开了一种智能语音分离与识别的会议转录方法、装置及系统。该方法包括通过麦克风阵列捕捉与会人员的语音信息;通过端到端语音分离模块对捕捉到的语音信息进行分割,得到多个子语音信息;将所述子语音信息和与会人员语音信息库进行匹配,以确定各个子语音信息对应的发音对象;将各个子语音信息通过语音识别模块转换为发音对象的文本输出。通过上述方式,结合高效的语音分离算法,能够有效地分离和识别重叠的语音信号,使得能够区分与会人员的角色并且每个与会人员的说话内容都能够被准确地识别出来,提高工作效率,改善沟通交流体验,并为用户提供更加便捷、安全和高效的服务。
技术关键词
智能语音
转录方法
声纹特征
转录装置
会议转录系统
语音识别模块
麦克风阵列
发音
交互式用户界面
矩阵
语音识别技术
对象
聚类
文本
音频特征
编码模块
系统为您推荐了相关专利信息
智能语音交互系统
实时语音
智能语音交互方法
模糊语义
动作特征
客服系统
智能外呼机器人
呼叫中心
微信公众号
支持二次开发
智能语音交互系统
流媒体服务器
音频
文本
人脸检测算法
煤矿井下施工
转录系统
钻孔作业
语音转录方法
生成作业