基于频域增强的跨模态视频敏感事件检索方法和系统

正文

推荐专利

申请号：CN202411672354

申请日期：2024-11-21

公开号：CN119719418A

公开日期：2025-03-28

类型：发明专利

摘要

本发明属于跨模态视频时刻定位技术领域，涉及一种基于频域增强的跨模态视频敏感事件检索方法和系统。该方法包括：获取文本和视频两个模态的数据，将两个模态的数据分别进行编码，得到两个模态的特征；通过快速傅里叶变换分别将两个模态的特征投影至频域，并实现视频模态的特征在频域中的增强，得到频域增强的视频特征；通过高斯分布为频域增强的视频特征生成正负候选视频段，分别表示最接近检索请求的和最不接近检索请求的候选视频段，选取最接近检索请求的候选视频段作为检索结果，从而实现跨模态的视频时刻定位；进而将正负候选视频段进行多尺度对比学习，提高正负候选视频段的生成质量，并提高跨模态视频敏感事件检索的准确率。

技术关键词

视频段事件检索方法跨模态样本多尺度存储计算机程序融合特征残差反馈可读存储介质文本特征提取模块检索系统定位技术数据语句计算机设备编码语义

系统为您推荐了相关专利信息

基于多尺度分层的隧道注浆材料应用效果预测方法及系统

隧道注浆材料拓扑结构特征数据多尺度语义特征

一种融合Mamba增强的双流遥感影像变化检测方法

变化检测网络遥感影像数据滑动窗口法多尺度特征学习预处理器

基于盲区轨迹补偿的城市快速路卡口设备布设优化方法

卡口设备车辆轨迹预测候选位置集合生成多尺度车道中心线

电价价差预测模型的训练方法和电价价差预测方法

样本数据可执行程序代码矩阵模型训练方法

基于多分支自适应深度融合的健康监测系统及装置

模态特征健康监测系统融合特征多模态多分支

基于频域增强的跨模态视频敏感事件检索方法和系统

站点导航

APP 下载