一种基于多说话人语音分离方法的质控报告自动生成系统

正文

推荐专利

申请号：CN202411002842

申请日期：2024-07-25

公开号：CN118782074A

公开日期：2024-10-15

类型：发明专利

摘要

本发明公开了一种基于多说话人语音分离方法的质控报告自动生成系统，包括基于超文本传输协议和网络应用服务器技术的语音接收模块、基于时频幅度掩蔽和卷积神经网络的语音分离模块、基于双向状态空间扩充变换器块的语音识别模块、质控报告生成模块、基于超文本传输协议和网络应用服务器技术的质控报告上传模块和基于容器引擎容器化部署和超文本传输协议的分布式部署模块，所述基于超文本传输协议和网络应用服务器技术的语音接收模块用于接收待处理语音，所述基于时频幅度掩蔽和卷积神经网络的语音分离模块用于分离出目标对象的单独语音，所述基于双向状态空间扩充变换器块的语音识别模块用于对语音进行识别并生成文本，所述质控报告生成模块用于对文件进行分析并生成所需质控报告，所述基于超文本传输协议和网络应用服务器技术的质控报告上传模块用于质控报告上传到后台系统，所述基于容器引擎容器化部署和超文本传输协议的分布式部署模块用于系统在多台服务器上实现分布式部署和互联。

技术关键词

自动生成系统超文本传输协议语音接收模块语音识别模块报告语句后台系统关键词语音识别模型分布式服务容器深度神经网络变换器服务器子模块注意力机制

一种基于多说话人语音分离方法的质控报告自动生成系统

站点导航

APP 下载