一种基于多模态大数据模型的语音识别处理系统

AITNT
正文
推荐专利
一种基于多模态大数据模型的语音识别处理系统
申请号:CN202511216722
申请日期:2025-08-28
公开号:CN120932651A
公开日期:2025-11-11
类型:发明专利
摘要
本发明适用于语音识别处理技术领域,提供了一种基于多模态大数据模型的语音识别处理系统,包括演讲底座,演讲底座上设置有演讲台,演讲台上设置有麦克风,演讲台的顶部设置有用于采集面部图像的高清摄像头,所述演讲底座内部为中空,演讲底座的上表面开设有多个与演讲底座内部连通的连通槽,多个连通槽以演讲台为中心并呈圆周阵列设置,演讲底座内设置有位于中心的控制壳体,控制壳体的底部设置有可推动控制壳体上下位移的推动组件,本发明通过调节组件控制可调活动板位移,因此可控制外部麦克风与麦克风之间的间距,通过动态调整外部麦克风与声源之间的距离,让一个麦克风阵列能在“高指向性”和“高容错性”两种模式之间动态切换。
技术关键词
演讲台 多模态 麦克风 活动板 安装座 云端服务器 壳体 语音 高清摄像头 滑动杆 底座 数据分析模块 锥齿轮 控制可调 转板 传动轴 交叉注意力机制 麻花杆 调节组件 遮挡板
系统为您推荐了相关专利信息
1
基于预训练模型和多任务学习的多模态情感识别方法及系统
预训练模型 情感识别方法 混合特征提取 多模态情感识别 多任务学习策略
2
基于多模态融合与一致性约束的数字人唇形驱动方法
参数化特征 驱动方法 人脸特征 多模态 语音特征
3
多模态语音识别方法、装置、设备及计算机可读介质
声学特征 唇形特征 语音识别模型 注意力编码器 语音编码
4
一种高效鲁棒的目标跟踪方法及其在智能监控中的应用
融合跟踪技术 跟踪方法 引入注意力机制 多模态 跟踪成功率
5
企业门户产品的界面配置方法、装置、设备及介质
多模态 噪声数据 界面配置方法 交通状况分析 数据采集终端设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号