一种视频会议场景下实时语音识别系统、方法、存储介质及设备

AITNT
正文
推荐专利
一种视频会议场景下实时语音识别系统、方法、存储介质及设备
申请号:CN202510348030
申请日期:2025-03-24
公开号:CN120183412A
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了一种视频会议场景下实时语音识别系统、方法、存储介质及设备,包括:RTP对时模块用于同步服务端和各客户端的时间戳,并将时间戳的基准信息传入音频处理模块;音频处理模块用于对客户端的音频进行编码,将编码的音频以及客户端的麦克风状态发送给智能调度模块;智能调度模块通过智能调度算法将编码的音频创建到对应的语音识别实例中,并将编码的音频传送到语音识别模块;语音识别模块用于音频的语音识别,将识别的信息发送给结果处理模块;结果处理模块将识别的信息转发给实施撰写内容展示模块进行展示。本发明通过智能调度复用语音识别实例,减小语音识别模块的负载,能够兼顾视频会议中的各种发言场景,保证语音识别效果。
技术关键词
视频会议场景 实时语音 语音识别模块 识别系统 客户端 智能调度算法 音频传送 编码 识别方法 服务端 麦克风 基准 处理器 可读存储介质 存储器 计算机 电子设备
系统为您推荐了相关专利信息
1
关于音频信息混淆可逆对抗样本的隐私保护方法、装置
自动语音识别系统 对抗性 隐私保护方法 傅里叶变换函数 掩码矩阵
2
一种药品生产质量检测装置及方法
图像识别系统 辐射系统 超声探测系统 超声探测头 超声波探测系统
3
基于自蒸馏卷积神经网络的甲状腺结节识别系统
卷积神经网络模型 蒸馏 输出特征 交互网络 识别系统
4
基于造影图像的分叉血管自动化识别方法及系统
自动化识别方法 融合多模态特征 形态学特征 血流 图像
5
一种基于隐私集合求交的通信高效数据开放共享方法及系统
布隆过滤器 共享方法 数据开放共享 客户端 公钥加密体制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号