一种音视频多模态识别方法及系统

正文

推荐专利

一种音视频多模态识别方法及系统

申请号：CN202510230366

申请日期：2025-02-28

公开号：CN119723428B

公开日期：2025-06-13

类型：发明专利

摘要

本发明涉及数据处理技术领域，具体涉及一种音视频多模态识别方法及系统，包括：感知层、识别层、指示层；采集设备运行采集的视频数据实时向感知层中上传，感知层同步感知采集设备姿态，基于采集的视频及采集设备姿态锁定追踪目标，同步提取追踪目标特征参数，识别层进一步接收感知层中提取的追踪目标特征参数，同步控制感知层再次运行锁定追踪目标，本发明以采集设备为主体对采集设备采集的视频数据进行处理，于视频数据中获取追踪目标，并以指定的反复锁定逻辑最终确定明确的追踪目标，进一步以帧级图像处理及分析技术，对追踪目标进行持续的追踪，从而以此提供系统端用户指示，在追踪目标的追踪场景中，为系统端用户带来辅助追踪效果。

技术关键词

采集设备音视频多模态识别系统辨识模块识别模块动态识别视频数据视频音频录制功能控制模块无线网络画面识别方法指定时间间隔特征参数提取图像音频模组

系统为您推荐了相关专利信息

一种大学生创新创业评价系统

大学生创新创业评价系统能力评估模型风险分析报告图像识别系统

一种会话处理方法、装置、设备及存储介质

历史会话意图识别模型媒体多模态计算机程序产品

智能多模态医用氧气流量监测系统、装置及方法

医用氧气流量监测系统多模态状态空间模型传感器模块

基于北斗卫星的紧急通信与定位系统及方法

短距离无线通信协议路径优化算法北斗卫星信号定位方法传输路径

基于多模态遥感数据的进度识别方法

进度识别方法多模态三维点云数据坐标无人机飞行航线

一种音视频多模态识别方法及系统

站点导航

APP 下载