一种基于对应学习的点级监督视频片段定位方法及系统与应用

AITNT
正文
推荐专利
一种基于对应学习的点级监督视频片段定位方法及系统与应用
申请号:CN202411437227
申请日期:2024-10-15
公开号:CN119649260B
公开日期:2025-10-24
类型:发明专利
摘要
本发明涉及一种基于对应学习的点级监督视频片段定位方法及系统与应用,属于目标视频片段定位技术领域,包括:先通过预训练模型提取特征,获得增强的视觉表示与增强的文本表示,对其进行处理,获得多粒度的文本表示与多粒度的视觉表示;最后对多粒度的文本表示最大池化,得到整合了整个句子语义信息的表示;在训练阶段利用高斯分布结合关键帧,对不同的视频片段进行度量;在推理阶段先识别出视频与查询的最佳匹配关键点再从该点扩展以获得与查询最相似的预测视频片段;利用由全局对齐损失、帧‑片段对应损失、片段‑帧对应损失三部分构成的模型损失优化模型。本发明解决了点监督下进行视频片段定位存在的粒度与尺度问题,有效提升了模型性能。
技术关键词
视频片段定位方法 文本 对齐模块 跨模态 多头注意力机制 语义 视觉特征 预训练模型 关键点 特征提取模块 滑动窗口 多模态交互 阶段 查询特征 大规模语料库 关键帧 加权损失函数
系统为您推荐了相关专利信息
1
大语言模型高质量文本数据集构建方法及系统
文本 数据集构建方法 行业词典 大语言模型 实体
2
一种基于跨模态特征的漏洞定位方法及系统
跨模态 漏洞定位方法 特征提取模块 代码特征 文本
3
一种基于AHP-模糊综合评价法的电商在线评论质量定量方法
定量计算方法 定量方法 指标 模糊综合评价法 覆盖率
4
一种电梯参数智能采集系统与方法
合格证 智能采集系统 拍摄设备 录入系统 识别设备
5
一种高性能的轻量化识别模型部署方法
模型部署方法 表格 高性能 文本行 增值税发票
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号