智能语音分离与识别的会议转录方法、装置及系统

正文

推荐专利

申请号：CN202410916243

申请日期：2024-07-09

公开号：CN118782073A

公开日期：2024-10-15

类型：发明专利

摘要

本发明属于语音识别技术领域，公开了一种智能语音分离与识别的会议转录方法、装置及系统。该方法包括通过麦克风阵列捕捉与会人员的语音信息；通过端到端语音分离模块对捕捉到的语音信息进行分割，得到多个子语音信息；将所述子语音信息和与会人员语音信息库进行匹配，以确定各个子语音信息对应的发音对象；将各个子语音信息通过语音识别模块转换为发音对象的文本输出。通过上述方式，结合高效的语音分离算法，能够有效地分离和识别重叠的语音信号，使得能够区分与会人员的角色并且每个与会人员的说话内容都能够被准确地识别出来，提高工作效率，改善沟通交流体验，并为用户提供更加便捷、安全和高效的服务。

技术关键词

智能语音转录方法声纹特征转录装置会议转录系统语音识别模块麦克风阵列发音交互式用户界面矩阵语音识别技术对象聚类文本音频特征编码模块

系统为您推荐了相关专利信息

一种麻醉苏醒期智能语音交互系统及其方法

智能语音交互系统实时语音智能语音交互方法模糊语义动作特征

一种人工智能时代的云客服系统及方法

客服系统智能外呼机器人呼叫中心微信公众号支持二次开发

一种基于视觉和大模型的仿真数字人实时智能语音交互系统及其方法

智能语音交互系统流媒体服务器音频文本人脸检测算法

一种煤矿井下施工语音转录系统及转录方法

煤矿井下施工转录系统钻孔作业语音转录方法生成作业

多模态智能终端的智能语音质量评价方法及装置

智能语音智能终端多模态评价方法文本

智能语音分离与识别的会议转录方法、装置及系统

站点导航

APP 下载