视频时刻定位的方法、装置、设备及介质

AITNT
正文
推荐专利
视频时刻定位的方法、装置、设备及介质
申请号:CN202411510544
申请日期:2024-10-25
公开号:CN119339294A
公开日期:2025-01-21
类型:发明专利
摘要
本申请属于视频时刻定位技术领域,公开了一种视频时刻定位的方法、装置、设备及介质,方法包括步骤:利用对比损失函数对VTG模型进行训练,获取目标VTG模型;利用目标VTG模型生成多个候选框及第一粗粒度分数;构建目标视频‑文本模型,并利用目标视频‑文本预训练模型提取各候选框的视频特征及文本特征;根据所述视频特征及文本特征计算各候选框的细粒度分数,根据第一粗粒度分数及细粒度分数计算所述候选框的总得分,利用所述总得分对各个候选框进行细粒度排序;根据所述细粒度排序对输入视频进行视频时刻定位。实施本发明,解决了导致正负样本不平衡问题,改善了模型的鲁棒性。提高了细粒度排序对下游任务的匹配,增强了对候选框的准确排序。
技术关键词
视频 文本 计算机可读指令 转换器模块 样本 关键帧 可读存储介质 预训练模型 适配器 定位技术 处理器 计算机设备 定位模块 分类器 存储器 鲁棒性 注意力
系统为您推荐了相关专利信息
1
长文本的延迟分块嵌入处理方法、装置及存储介质
分块策略 序列 滑动窗口 非暂态计算机可读存储介质 语义向量
2
一种基于AGV的变压器智能搬运方法及系统、电子设备
搬运方法 承重梁 变压器 相机模块 融合多传感器数据
3
五官分割、样本生成与模型训练方法、设备、存储介质及程序产品
三维模型 轮廓信息 顶点 基础 形态
4
基于大数据的分析处理系统
关键帧 大数据 镜头 视频 并行处理数据
5
消防逃生路径规划方法、系统及计算设备
三维网格模型 节点 视频采集设备 逃生路径规划方法 烟雾
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号