一种视频会议场景下实时语音识别系统、方法、存储介质及设备

正文

推荐专利

申请号：CN202510348030

申请日期：2025-03-24

公开号：CN120183412A

公开日期：2025-06-20

类型：发明专利

摘要

本发明公开了一种视频会议场景下实时语音识别系统、方法、存储介质及设备，包括：RTP对时模块用于同步服务端和各客户端的时间戳，并将时间戳的基准信息传入音频处理模块；音频处理模块用于对客户端的音频进行编码，将编码的音频以及客户端的麦克风状态发送给智能调度模块；智能调度模块通过智能调度算法将编码的音频创建到对应的语音识别实例中，并将编码的音频传送到语音识别模块；语音识别模块用于音频的语音识别，将识别的信息发送给结果处理模块；结果处理模块将识别的信息转发给实施撰写内容展示模块进行展示。本发明通过智能调度复用语音识别实例，减小语音识别模块的负载，能够兼顾视频会议中的各种发言场景，保证语音识别效果。

技术关键词

视频会议场景实时语音语音识别模块识别系统客户端智能调度算法音频传送编码识别方法服务端麦克风基准处理器可读存储介质存储器计算机电子设备

系统为您推荐了相关专利信息

关于音频信息混淆可逆对抗样本的隐私保护方法、装置

自动语音识别系统对抗性隐私保护方法傅里叶变换函数掩码矩阵

一种药品生产质量检测装置及方法

图像识别系统辐射系统超声探测系统超声探测头超声波探测系统

基于自蒸馏卷积神经网络的甲状腺结节识别系统

卷积神经网络模型蒸馏输出特征交互网络识别系统

基于造影图像的分叉血管自动化识别方法及系统

自动化识别方法融合多模态特征形态学特征血流图像

一种基于隐私集合求交的通信高效数据开放共享方法及系统

布隆过滤器共享方法数据开放共享客户端公钥加密体制

一种视频会议场景下实时语音识别系统、方法、存储介质及设备

站点导航

APP 下载