模型训练方法、视频定位方法、系统、设备、产品及介质

正文

推荐专利

申请号：CN202410853496

申请日期：2024-06-28

公开号：CN118395196B

公开日期：2024-09-17

类型：发明专利

摘要

本发明公开了一种模型训练方法、视频定位方法、系统、设备、产品及介质，涉及视频定位领域，用于解决传统方法中因忽略上下文信息而导致的事件定位准确性不足的问题。该方案通过获取训练视频数据，根据每个视觉片段和音频片段的起始时间和结束时间确定视觉拓展片段和音频拓展片段，并根据视觉拓展片段和音频拓展片段优化视频定位模型，得到目标视频定位模型，目标视频定位模型用于对待处理视频数据进行类别标签定位。通过引入拓展片段，更全面地考虑事件在时间和空间上的延续性，有效地避免了局部信息的限制，使得模型能够更全面地理解和分析视频中的事件，提升了事件定位的精度和鲁棒性。

技术关键词

模型训练方法预测类别融合视觉特征视频定位方法标签序列音频特征拓展单元非易失性存储介质模型训练系统注意力机制存储计算机程序数据分支计算机程序产品

系统为您推荐了相关专利信息

图标生成方法、系统、设备及存储介质

图标生成方法关键词生成图标生成程序加密数据

一种无人机的采集数据的传输方法、设备及介质

非对称加密算法传输方法无人机遥控器加密模块非瞬时性计算机可读存储介质

一种基于生成式步骤级奖励模型的大语言模型推理方法

推理方法大语言模型数据模板标签

一种基于家具的知识图谱构建方法和家具知识推荐系统

知识图谱构建方法家具知识图谱架构推荐系统构建用户画像

一种基于三维采样的袜子样式辅助设计系统

足部三维模型辅助设计系统袜子样式坐标系

模型训练方法、视频定位方法、系统、设备、产品及介质

站点导航

APP 下载