混合专家思维增强的大模型低空视频事件检测方法及装置

AITNT
正文
推荐专利
混合专家思维增强的大模型低空视频事件检测方法及装置
申请号:CN202511095285
申请日期:2025-08-06
公开号:CN120599523A
公开日期:2025-09-05
类型:发明专利
摘要
本发明提供了一种混合专家思维增强的大模型低空视频事件检测方法及装置,涉及人工智能技术领域,旨在解决现有视频事件检测方法由于没有充分考虑视频中的动态信息、事件特性以及事件发生的瞬时性,导致检测精度和检测效率低下的技术问题。该方法包括:对获取的低空视频事件数据进行多模态特征提取,得到RGB图像特征、光流图像特征和音频特征;然后统一映射至同一大语言模型的表示空间进行语义对齐处理,得到多模态语义标记序列;再将多模态语义标记序列输入预先构建的混合专家模型,利用模态路由器为各模态特征匹配对应的专家模型;根据匹配到的专家模型,对多模态特征进行分类检测;融合各专家模型的分类检测结果得到最终低空视频事件检测结果。
技术关键词
视频事件检测方法 多模态 音频特征 模态特征 标记 图像 大语言模型 序列 路由器 视频事件检测装置 关键帧 语义特征 语音识别模型 数据 处理器 分支 人工智能技术
系统为您推荐了相关专利信息
1
一种混合专家多模态大模型特征融合方法及系统
特征融合方法 多模态 学生 教师 蒸馏
2
构建岩土三维虚拟模型的方法、设备、介质及产品
三维虚拟模型 岩土勘察设备 图像融合方法 处理器 计算机程序产品
3
一种基于电、热应力的电力电子器件寿命评估方法及系统
电力电子器件 寿命预测模型 退化特征 多模态特征融合 特征提取单元
4
一种认知驱动的渐进对齐模态自适应的多模态情感识别方法及系统
多模态情感识别 特征加权融合 情感识别方法 跨模态 注意力
5
招标信息处理方法、装置、设备、存储介质及程序产品
文本 信息处理方法 实体 信息抽取模型 编码模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号