摘要
本发明适用于语音识别处理技术领域,提供了一种基于多模态大数据模型的语音识别处理系统,包括演讲底座,演讲底座上设置有演讲台,演讲台上设置有麦克风,演讲台的顶部设置有用于采集面部图像的高清摄像头,所述演讲底座内部为中空,演讲底座的上表面开设有多个与演讲底座内部连通的连通槽,多个连通槽以演讲台为中心并呈圆周阵列设置,演讲底座内设置有位于中心的控制壳体,控制壳体的底部设置有可推动控制壳体上下位移的推动组件,本发明通过调节组件控制可调活动板位移,因此可控制外部麦克风与麦克风之间的间距,通过动态调整外部麦克风与声源之间的距离,让一个麦克风阵列能在“高指向性”和“高容错性”两种模式之间动态切换。
技术关键词
演讲台
多模态
麦克风
活动板
安装座
云端服务器
壳体
语音
高清摄像头
滑动杆
底座
数据分析模块
锥齿轮
控制可调
转板
传动轴
交叉注意力机制
麻花杆
调节组件
遮挡板
系统为您推荐了相关专利信息
预训练模型
情感识别方法
混合特征提取
多模态情感识别
多任务学习策略
声学特征
唇形特征
语音识别模型
注意力编码器
语音编码
融合跟踪技术
跟踪方法
引入注意力机制
多模态
跟踪成功率
多模态
噪声数据
界面配置方法
交通状况分析
数据采集终端设备