基于频域增强的跨模态视频敏感事件检索方法和系统

AITNT
正文
推荐专利
基于频域增强的跨模态视频敏感事件检索方法和系统
申请号:CN202411672354
申请日期:2024-11-21
公开号:CN119719418A
公开日期:2025-03-28
类型:发明专利
摘要
本发明属于跨模态视频时刻定位技术领域,涉及一种基于频域增强的跨模态视频敏感事件检索方法和系统。该方法包括:获取文本和视频两个模态的数据,将两个模态的数据分别进行编码,得到两个模态的特征;通过快速傅里叶变换分别将两个模态的特征投影至频域,并实现视频模态的特征在频域中的增强,得到频域增强的视频特征;通过高斯分布为频域增强的视频特征生成正负候选视频段,分别表示最接近检索请求的和最不接近检索请求的候选视频段,选取最接近检索请求的候选视频段作为检索结果,从而实现跨模态的视频时刻定位;进而将正负候选视频段进行多尺度对比学习,提高正负候选视频段的生成质量,并提高跨模态视频敏感事件检索的准确率。
技术关键词
视频段 事件检索方法 跨模态 样本 多尺度 存储计算机程序 融合特征 残差反馈 可读存储介质 文本 特征提取模块 检索系统 定位技术 数据 语句 计算机设备 编码 语义
系统为您推荐了相关专利信息
1
基于多尺度分层的隧道注浆材料应用效果预测方法及系统
隧道注浆材料 拓扑结构特征 数据 多尺度 语义特征
2
一种融合Mamba增强的双流遥感影像变化检测方法
变化检测网络 遥感影像数据 滑动窗口法 多尺度特征学习 预处理器
3
基于盲区轨迹补偿的城市快速路卡口设备布设优化方法
卡口设备 车辆轨迹预测 候选位置集合 生成多尺度 车道中心线
4
电价价差预测模型的训练方法和电价价差预测方法
样本 数据 可执行程序代码 矩阵 模型训练方法
5
基于多分支自适应深度融合的健康监测系统及装置
模态特征 健康监测系统 融合特征 多模态 多分支
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号