摘要
本发明涉及视频理解技术领域,具体公开一种跨模态电力视频定位方法、系统、电子设备和存储介质,包括:对每个样本电力视频依次进行视觉边界分割、语义边界分割与上下文动态聚合,得到每个样本电力视频对应的至少一个目标伪监督对;每个目标伪监督对包括:对应的样本电力视频、伪查询文本以及伪查询文本对应在样本电力视频中的起止时间;基于每个样本电力视频对应的目标伪监督对,对预设的跨模态电力视频定位模型进行训练,得到训练好的跨模态电力视频定位模型;将待测电力视频与查询文本输入训练好的跨模态电力视频定位模型,得到视频定位结果。本发明实现了稳健且高效的零样本跨模态电力异常行为定位,提高了跨模态电力视频定位的准确性和效率。
技术关键词
视频定位方法
电力
视觉
视频定位系统
关键帧
样本
跨模态
标签文本
语义
大语言模型
电子设备
可读存储介质
动态
理解技术
模块
处理器
计算机
多模态
系统为您推荐了相关专利信息
电容式电压互感器
监测方法
电力计量监测技术
电容电压互感器
CVT二次电压
投切开关
PCA算法
天线阵列
信号采集器
接收现场
电量分解方法
偏差
分析电力系统
历史负荷数据
多时间尺度
健康管家系统
动态权限管理
数据获取模块
存储模块
分析模块