基于多源数据融合学习的违规行为识别与检测方法及系统

正文

推荐专利

申请号：CN202510234875

申请日期：2025-02-28

公开号：CN119723681B

公开日期：2025-07-01

类型：发明专利

摘要

本发明涉及基于多源数据融合学习的违规行为识别与检测方法及系统，属于异常检测技术领域。步骤包括：（1）针对输入的视频信息，使用视频内容描述生成模块，生成对视频内容的整体文本描述；（2）针对输入视频、视频关键图片和视频描述文本进行多源多模态信息融合；（3）计算不同梯度组合的帕累托最优，使用该组合梯度更新整个模型。本发明通过将输入视频的多模态信息进行提取与融合，提升了模型在视频中提取人物行为的语义信息的能力，从而大大增强了模型识别与检测违规行为的性能。

技术关键词

多模态特征融合注意力融合特征损失计算方法图片异常检测技术优化网络参数变量文本编码器视频编码器大语言模型数据双模态模块定义

系统为您推荐了相关专利信息

遥感图像识别方法、模型及装置

遥感图像识别方法图像块注意力机制遥感图像识别技术非暂态计算机可读存储介质

基于主动学习的无源领域自适应方法

注意力原型分支特征提取方法标签

自动生成数字人物方法及系统

对象矩阵融合特征查询特征人脸特征

一种基于语义分割网络的雷达信号智能分选方法

语义分割网络脉冲分选方法辐射源像素点

一种基于元宇宙空间的轨迹规划方法、系统、介质及设备

轨迹规划方法空间特征提取动作预测模型三维卷积神经网络时空注意力机制

基于多源数据融合学习的违规行为识别与检测方法及系统

站点导航

APP 下载