摘要
本申请实施例提出了监控视频的多模态检索方法、系统、电子设备及存储介质,所述方法包括:获得用户输入的针对监控视频的搜索文本;根据所述搜索文本,从所述监控视频中获得目标图像;对所述搜索文本进行行业分类,根据所述搜索文本所属的目标行业类型对应的行业图谱,确定与所述搜索文本对应的衍生关系,并基于所述衍生关系生成目标检索报告的目标文本描述;基于所述目标文本描述和所述目标图像,生成所述目标检索报告,在上述技术方案中,通过搜索文本对应的衍生关系生成目标文本描述以及根据所述搜索文本从监控视频中获得的目标图像,生成图像与文字描述结合的更准确的检索报告。
技术关键词
文本
模态检索方法
图像
节点
视频
报告
图谱
语义
关系
关键帧
关键词
电子设备
检索系统
处理器
可读存储介质
存储器
计算机
互联网
模块
指令
系统为您推荐了相关专利信息
图像生成模型
空间结构
组件结构
非暂态计算机可读介质
图像结构
社交平台
识别方法
音频
深度神经网络模型
卷积神经网络模型
惯性导航辅助
缺陷自动识别
报告生成系统
缺陷检测算法
双目摄像头
输电设备状态监测
注意力
可见光图像
物联网传感器网络
风险