一种面向多模态视频的全流程动作识别方法

正文

推荐专利

一种面向多模态视频的全流程动作识别方法

申请号：CN202510074667

申请日期：2025-01-17

公开号：CN120032424B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开一种面向多模态视频的全流程动作识别方法，首先，通过优化面向多模态数据的增强技术来转换和扩展现有数据，以扩大训练规模。使用更多的RGB数据集对骨干网络进行预训练，并通过迁移学习使其更好地适应新任务。其次，借助2D CNNs提取多模态空间特征，并与时间位移模块结合，实现与3D CNNs相当的多模态空间‑时间特征提取，同时提高计算效率。使用预测增强方法，以整合不同训练阶段的同一架构和不同架构模型的知识，从而从不同角度预测动作并充分利用目标信息。本发明既能克服数据稀缺和过拟合问题，又能提高时空建模能力，并有效融合多模态信息。

技术关键词

动作识别模型动作识别方法视频帧阶段面向多模态数据融合多模态信息卷积神经网络提取超参数分辨率可读存储介质图像框架模块指令时序规模计算机

系统为您推荐了相关专利信息

一种基于少样本学习的通用AI生成图像检测方法及系统

嵌入特征图像检测方法特征提取模型特征提取模块转换器模块

一种面向多核芯片的容错编译方法及其装置

编译方法编译装置核心标识符逻辑硬件计数器

注塑制品的质量管理方法、装置、系统、设备及可读介质

注塑制品数学模型压力传感器阶段模具

一种光伏发电工程成本优化方法及装置

光伏发电工程历史故障数据 LSTM模型预测故障率列表

一种智能医院门诊系统

数据处理中心患者客户端节点树状网络

一种面向多模态视频的全流程动作识别方法

站点导航

APP 下载