模型训练方法、视频定位方法、系统、设备、产品及介质

正文

推荐专利

申请号：CN202410853495

申请日期：2024-06-28

公开号：CN118395195B

公开日期：2024-09-24

类型：发明专利

摘要

本发明公开了一种模型训练方法、视频定位方法、系统、设备、产品及介质，涉及视频数据处理领域，用于解决定位音频事件时将视频模态视作噪声导致定位不准确的问题。获取训练数据集；根据视觉特征得到第一知识图结构，根据音频特征得到第二知识图结构；根据两个知识图结构对第一神经网络模型优化得到目标神经网络模型，目标神经网络模型用于对待处理视频数据进行类别标签定位。本发明通过构建视觉特征和音频特征对应的知识图结构，使用知识图结构优化第一神经网络模型，并未将视觉信息视为噪声，能捕捉和利用音频与视频间的复杂关联关系，能够更好地整合和利用多模态数据，提高得到的目标神经网络模型的定位精度和可靠性。

技术关键词

神经网络模型音频特征视觉特征模型训练方法视频定位方法矩阵邻居非易失性存储介质样本存储计算机程序模型训练系统数据参数标签计算机程序产品节点处理器

系统为您推荐了相关专利信息

基于气象光谱仪的多频段可视化气象动态监测方法及装置

动态监测方法气象光谱仪 PLS模型神经网络模型

显示方法、装置、设备及存储介质

手语动画电视显示界面深度神经网络模型音频同步显示字幕

基于物理信息神经网络的复合材料热化学烧蚀计算方法

碳复合材料热传导方程增广拉格朗日物理误差方法

基于种子队列优化的模糊测试方法

模糊测试方法种子深度学习模型转换后图像队列

一种适应季节变化的新型电力系统等效惯量短期预测方法

短期预测方法新型电力系统特征提取算法复合多尺度归一化方法

模型训练方法、视频定位方法、系统、设备、产品及介质

站点导航

APP 下载