模型训练方法、视频定位方法、系统、设备、产品及介质

AITNT
正文
推荐专利
模型训练方法、视频定位方法、系统、设备、产品及介质
申请号:CN202410853496
申请日期:2024-06-28
公开号:CN118395196B
公开日期:2024-09-17
类型:发明专利
摘要
本发明公开了一种模型训练方法、视频定位方法、系统、设备、产品及介质,涉及视频定位领域,用于解决传统方法中因忽略上下文信息而导致的事件定位准确性不足的问题。该方案通过获取训练视频数据,根据每个视觉片段和音频片段的起始时间和结束时间确定视觉拓展片段和音频拓展片段,并根据视觉拓展片段和音频拓展片段优化视频定位模型,得到目标视频定位模型,目标视频定位模型用于对待处理视频数据进行类别标签定位。通过引入拓展片段,更全面地考虑事件在时间和空间上的延续性,有效地避免了局部信息的限制,使得模型能够更全面地理解和分析视频中的事件,提升了事件定位的精度和鲁棒性。
技术关键词
模型训练方法 预测类别 融合视觉特征 视频定位方法 标签 序列 音频特征 拓展单元 非易失性存储介质 模型训练系统 注意力机制 存储计算机程序 数据 分支 计算机程序产品
系统为您推荐了相关专利信息
1
图标生成方法、系统、设备及存储介质
图标生成方法 关键词 生成图标 生成程序 加密数据
2
一种无人机的采集数据的传输方法、设备及介质
非对称加密算法 传输方法 无人机遥控器 加密模块 非瞬时性计算机可读存储介质
3
一种基于生成式步骤级奖励模型的大语言模型推理方法
推理方法 大语言模型 数据 模板 标签
4
一种基于家具的知识图谱构建方法和家具知识推荐系统
知识图谱构建方法 家具 知识图谱架构 推荐系统 构建用户画像
5
一种基于三维采样的袜子样式辅助设计系统
足部三维模型 辅助设计系统 袜子 样式 坐标系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号