摘要
本发明涉及数据处理技术领域,具体涉及一种音视频多模态识别方法及系统,包括:感知层、识别层、指示层;采集设备运行采集的视频数据实时向感知层中上传,感知层同步感知采集设备姿态,基于采集的视频及采集设备姿态锁定追踪目标,同步提取追踪目标特征参数,识别层进一步接收感知层中提取的追踪目标特征参数,同步控制感知层再次运行锁定追踪目标,本发明以采集设备为主体对采集设备采集的视频数据进行处理,于视频数据中获取追踪目标,并以指定的反复锁定逻辑最终确定明确的追踪目标,进一步以帧级图像处理及分析技术,对追踪目标进行持续的追踪,从而以此提供系统端用户指示,在追踪目标的追踪场景中,为系统端用户带来辅助追踪效果。
技术关键词
采集设备
音视频
多模态
识别系统
辨识模块
识别模块
动态
识别视频数据
视频音频录制功能
控制模块
无线网络
画面
识别方法
指定时间间隔
特征参数提取
图像
音频模组
系统为您推荐了相关专利信息
大学生创新创业
评价系统
能力评估模型
风险分析报告
图像识别系统
历史会话
意图识别模型
媒体
多模态
计算机程序产品
医用氧气流量
监测系统
多模态
状态空间模型
传感器模块
短距离无线通信协议
路径优化算法
北斗卫星信号
定位方法
传输路径
进度识别方法
多模态
三维点云数据
坐标
无人机飞行航线