一种基于多说话人语音分离方法的质控报告自动生成系统

AITNT
正文
推荐专利
一种基于多说话人语音分离方法的质控报告自动生成系统
申请号:CN202411002842
申请日期:2024-07-25
公开号:CN118782074A
公开日期:2024-10-15
类型:发明专利
摘要
本发明公开了一种基于多说话人语音分离方法的质控报告自动生成系统,包括基于超文本传输协议和网络应用服务器技术的语音接收模块、基于时频幅度掩蔽和卷积神经网络的语音分离模块、基于双向状态空间扩充变换器块的语音识别模块、质控报告生成模块、基于超文本传输协议和网络应用服务器技术的质控报告上传模块和基于容器引擎容器化部署和超文本传输协议的分布式部署模块,所述基于超文本传输协议和网络应用服务器技术的语音接收模块用于接收待处理语音,所述基于时频幅度掩蔽和卷积神经网络的语音分离模块用于分离出目标对象的单独语音,所述基于双向状态空间扩充变换器块的语音识别模块用于对语音进行识别并生成文本,所述质控报告生成模块用于对文件进行分析并生成所需质控报告,所述基于超文本传输协议和网络应用服务器技术的质控报告上传模块用于质控报告上传到后台系统,所述基于容器引擎容器化部署和超文本传输协议的分布式部署模块用于系统在多台服务器上实现分布式部署和互联。
技术关键词
自动生成系统 超文本传输协议 语音接收模块 语音识别模块 报告 语句 后台系统 关键词 语音识别模型 分布式服务 容器 深度神经网络 变换器 服务器 子模块 注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号