一种音视频多模态识别方法及系统

AITNT
正文
推荐专利
一种音视频多模态识别方法及系统
申请号:CN202510230366
申请日期:2025-02-28
公开号:CN119723428B
公开日期:2025-06-13
类型:发明专利
摘要
本发明涉及数据处理技术领域,具体涉及一种音视频多模态识别方法及系统,包括:感知层、识别层、指示层;采集设备运行采集的视频数据实时向感知层中上传,感知层同步感知采集设备姿态,基于采集的视频及采集设备姿态锁定追踪目标,同步提取追踪目标特征参数,识别层进一步接收感知层中提取的追踪目标特征参数,同步控制感知层再次运行锁定追踪目标,本发明以采集设备为主体对采集设备采集的视频数据进行处理,于视频数据中获取追踪目标,并以指定的反复锁定逻辑最终确定明确的追踪目标,进一步以帧级图像处理及分析技术,对追踪目标进行持续的追踪,从而以此提供系统端用户指示,在追踪目标的追踪场景中,为系统端用户带来辅助追踪效果。
技术关键词
采集设备 音视频 多模态 识别系统 辨识模块 识别模块 动态 识别视频数据 视频音频录制功能 控制模块 无线网络 画面 识别方法 指定时间间隔 特征参数提取 图像 音频模组
系统为您推荐了相关专利信息
1
一种大学生创新创业评价系统
大学生创新创业 评价系统 能力评估模型 风险分析报告 图像识别系统
2
一种会话处理方法、装置、设备及存储介质
历史会话 意图识别模型 媒体 多模态 计算机程序产品
3
智能多模态医用氧气流量监测系统、装置及方法
医用氧气流量 监测系统 多模态 状态空间模型 传感器模块
4
基于北斗卫星的紧急通信与定位系统及方法
短距离无线通信协议 路径优化算法 北斗卫星信号 定位方法 传输路径
5
基于多模态遥感数据的进度识别方法
进度识别方法 多模态 三维点云数据 坐标 无人机飞行航线
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号