基于注意力机制的视频类别预测方法及相关设备

正文

推荐专利

申请号：CN202411444491

申请日期：2024-10-16

公开号：CN119360275A

公开日期：2025-01-24

类型：发明专利

摘要

本申请实施例提供了一种基于注意力机制的视频类别预测方法及相关设备，属于人工智能技术领域。该方法包括：对待预测视频的目标图像数据进行特征提取，得到目标图像特征和目标全局特征。分别通过特征映射层和局部注意力网络对目标图像进行处理，得到目标局部特征。通过特征融合层对局部和全局的特征进行融合，得到目标复合特征。获取每一目标图像数据的目标复合特征，得到多个目标复合特征，通过时序池化模块对多个目标复合特征进行时序特征学习，得到复合时序特征。根据复合时序特征对目标图像数据进行类别预测，得到预测目标类别。准确的提取出目标局部特征后，再基于复合时序特征进行预测，提高了视频类别预测的准确性。

技术关键词

类别预测模型时序特征类别预测方法图像注意力机制数据视频网络可读存储介质特征提取模块人工智能技术预测装置电子设备策略标签处理器输入模块

系统为您推荐了相关专利信息

一种智能会议管理方法及系统

智能会议管理系统发言人人脸图像捕捉会议管理方法麦克风阵列

一种基于卷积神经网络的多模态前列腺图像配准方法

图像配准方法混合网络模型执行编码解码标签多模态

身份信息提取方法和装置、电子设备及存储介质

信息提取模型样本图像特征数据身份信息提取方法嵌入特征

基于空间混合注意力的神经辐射场三维重建方法

三维重建方法采样点颜色多层感知机计算机程序指令

堆取料机寻址的路径规划方法、装置、介质及设备

露天料场堆取料机动态摄像头无人机地面

基于注意力机制的视频类别预测方法及相关设备

站点导航

APP 下载