混合专家思维增强的大模型低空视频事件检测方法及装置

正文

推荐专利

申请号：CN202511095285

申请日期：2025-08-06

公开号：CN120599523A

公开日期：2025-09-05

类型：发明专利

摘要

本发明提供了一种混合专家思维增强的大模型低空视频事件检测方法及装置，涉及人工智能技术领域，旨在解决现有视频事件检测方法由于没有充分考虑视频中的动态信息、事件特性以及事件发生的瞬时性，导致检测精度和检测效率低下的技术问题。该方法包括：对获取的低空视频事件数据进行多模态特征提取，得到RGB图像特征、光流图像特征和音频特征；然后统一映射至同一大语言模型的表示空间进行语义对齐处理，得到多模态语义标记序列；再将多模态语义标记序列输入预先构建的混合专家模型，利用模态路由器为各模态特征匹配对应的专家模型；根据匹配到的专家模型，对多模态特征进行分类检测；融合各专家模型的分类检测结果得到最终低空视频事件检测结果。

技术关键词

视频事件检测方法多模态音频特征模态特征标记图像大语言模型序列路由器视频事件检测装置关键帧语义特征语音识别模型数据处理器分支人工智能技术

系统为您推荐了相关专利信息

一种混合专家多模态大模型特征融合方法及系统

特征融合方法多模态学生教师蒸馏

构建岩土三维虚拟模型的方法、设备、介质及产品

三维虚拟模型岩土勘察设备图像融合方法处理器计算机程序产品

一种基于电、热应力的电力电子器件寿命评估方法及系统

电力电子器件寿命预测模型退化特征多模态特征融合特征提取单元

一种认知驱动的渐进对齐模态自适应的多模态情感识别方法及系统

多模态情感识别特征加权融合情感识别方法跨模态注意力

招标信息处理方法、装置、设备、存储介质及程序产品

文本信息处理方法实体信息抽取模型编码模块

混合专家思维增强的大模型低空视频事件检测方法及装置

站点导航

APP 下载