摘要
本发明公开了一种视频会议场景下实时语音识别系统、方法、存储介质及设备,包括:RTP对时模块用于同步服务端和各客户端的时间戳,并将时间戳的基准信息传入音频处理模块;音频处理模块用于对客户端的音频进行编码,将编码的音频以及客户端的麦克风状态发送给智能调度模块;智能调度模块通过智能调度算法将编码的音频创建到对应的语音识别实例中,并将编码的音频传送到语音识别模块;语音识别模块用于音频的语音识别,将识别的信息发送给结果处理模块;结果处理模块将识别的信息转发给实施撰写内容展示模块进行展示。本发明通过智能调度复用语音识别实例,减小语音识别模块的负载,能够兼顾视频会议中的各种发言场景,保证语音识别效果。
技术关键词
视频会议场景
实时语音
语音识别模块
识别系统
客户端
智能调度算法
音频传送
编码
识别方法
服务端
麦克风
基准
处理器
可读存储介质
存储器
计算机
电子设备
系统为您推荐了相关专利信息
自动语音识别系统
对抗性
隐私保护方法
傅里叶变换函数
掩码矩阵
图像识别系统
辐射系统
超声探测系统
超声探测头
超声波探测系统
卷积神经网络模型
蒸馏
输出特征
交互网络
识别系统
自动化识别方法
融合多模态特征
形态学特征
血流
图像
布隆过滤器
共享方法
数据开放共享
客户端
公钥加密体制