摘要
本发明属于视频分析技术领域,涉及一种基于多模态检索增强生成的站内异常分析方法、系统和可读介质,包括:采集具有异常行为的视频监控图像,并对其进行数据标注;将视频监控图像和数据标注输入多模态大模型,对多模态特征进行提取,一方面进行图像特征提取,提取出关键的视觉特征,另一方面进行文本特征提取,生成文本特征向量;将多模态大模型的输出结果作为上下文信息,输入到检索增加生成模型中,生成特征向量,根据特征向量与知识库中的条目进行对比,输出最相似的若干条条目;根据输出的条目,生成异常分析报告。其实现了对人和物体异常行为的高效识别和分析,提高了异常行为检测的准确性,能够快速、准确地识别复杂场景中的各种异常情况。
技术关键词
视频监控图像
异常分析方法
多模态
文本特征向量
条目
生成特征向量
视觉特征
图像特征提取
模态特征
视频分析技术
异常状态
视频监控设备
报告
可读存储介质
数据
多层感知机
注意力机制
分析系统
计算方法
系统为您推荐了相关专利信息
转向架检测系统
图像检测装置
工位
激光测距仪
防护装置
展厅展示系统
多媒体
雷达传感器
动态
特征提取器
异常数据
分类方法
融合特征
多模态数据融合
可视化单元