一种基于多模态大数据模型的语音识别处理系统

正文

推荐专利

申请号：CN202511216722

申请日期：2025-08-28

公开号：CN120932651A

公开日期：2025-11-11

类型：发明专利

摘要

本发明适用于语音识别处理技术领域，提供了一种基于多模态大数据模型的语音识别处理系统，包括演讲底座，演讲底座上设置有演讲台，演讲台上设置有麦克风，演讲台的顶部设置有用于采集面部图像的高清摄像头，所述演讲底座内部为中空，演讲底座的上表面开设有多个与演讲底座内部连通的连通槽，多个连通槽以演讲台为中心并呈圆周阵列设置，演讲底座内设置有位于中心的控制壳体，控制壳体的底部设置有可推动控制壳体上下位移的推动组件，本发明通过调节组件控制可调活动板位移，因此可控制外部麦克风与麦克风之间的间距，通过动态调整外部麦克风与声源之间的距离，让一个麦克风阵列能在“高指向性”和“高容错性”两种模式之间动态切换。

技术关键词

演讲台多模态麦克风活动板安装座云端服务器壳体语音高清摄像头滑动杆底座数据分析模块锥齿轮控制可调转板传动轴交叉注意力机制麻花杆调节组件遮挡板

系统为您推荐了相关专利信息

基于预训练模型和多任务学习的多模态情感识别方法及系统

预训练模型情感识别方法混合特征提取多模态情感识别多任务学习策略

基于多模态融合与一致性约束的数字人唇形驱动方法

参数化特征驱动方法人脸特征多模态语音特征

多模态语音识别方法、装置、设备及计算机可读介质

声学特征唇形特征语音识别模型注意力编码器语音编码

一种高效鲁棒的目标跟踪方法及其在智能监控中的应用

融合跟踪技术跟踪方法引入注意力机制多模态跟踪成功率

企业门户产品的界面配置方法、装置、设备及介质

多模态噪声数据界面配置方法交通状况分析数据采集终端设备

一种基于多模态大数据模型的语音识别处理系统

站点导航

APP 下载