视频时刻定位的方法、装置、设备及介质

正文

推荐专利

视频时刻定位的方法、装置、设备及介质

申请号：CN202411510544

申请日期：2024-10-25

公开号：CN119339294A

公开日期：2025-01-21

类型：发明专利

摘要

本申请属于视频时刻定位技术领域，公开了一种视频时刻定位的方法、装置、设备及介质，方法包括步骤：利用对比损失函数对VTG模型进行训练，获取目标VTG模型；利用目标VTG模型生成多个候选框及第一粗粒度分数；构建目标视频‑文本模型，并利用目标视频‑文本预训练模型提取各候选框的视频特征及文本特征；根据所述视频特征及文本特征计算各候选框的细粒度分数，根据第一粗粒度分数及细粒度分数计算所述候选框的总得分，利用所述总得分对各个候选框进行细粒度排序；根据所述细粒度排序对输入视频进行视频时刻定位。实施本发明，解决了导致正负样本不平衡问题，改善了模型的鲁棒性。提高了细粒度排序对下游任务的匹配，增强了对候选框的准确排序。

技术关键词

视频文本计算机可读指令转换器模块样本关键帧可读存储介质预训练模型适配器定位技术处理器计算机设备定位模块分类器存储器鲁棒性注意力

系统为您推荐了相关专利信息

长文本的延迟分块嵌入处理方法、装置及存储介质

分块策略序列滑动窗口非暂态计算机可读存储介质语义向量

一种基于AGV的变压器智能搬运方法及系统、电子设备

搬运方法承重梁变压器相机模块融合多传感器数据

五官分割、样本生成与模型训练方法、设备、存储介质及程序产品

三维模型轮廓信息顶点基础形态

基于大数据的分析处理系统

关键帧大数据镜头视频并行处理数据

消防逃生路径规划方法、系统及计算设备

三维网格模型节点视频采集设备逃生路径规划方法烟雾

视频时刻定位的方法、装置、设备及介质

站点导航

APP 下载