一种模型训练方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202510488771

申请日期：2025-04-18

公开号：CN120339802A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种模型训练方法、装置、电子设备和存储介质。包括：基于目标训练时空分辨率对原始视频帧序列进行采样，得到目标训练数据；将目标训练数据输入教师模型，通过动态令牌选择生成目标令牌集合以及通过前向传播生成教师训练特征；根据教师模型的目标自注意力权重对目标令牌集合进行多尺度裁剪，生成至少三种不同令牌数量的学生训练掩码；将目标训练数据和不同学生训练掩码输入学生模型进行前向传播，生成学生训练特征；将学生训练特征与教师训练特征进行对齐蒸馏，以得到目标学生模型。解决视频理解模型在下游灵活推理上的不足，利用高时空分辨率下的动态令牌选择和多尺度掩码训练，使得模型能在各种下游计算量限制下取得较优性能。

技术关键词

训练特征教师学生动态令牌注意力模型训练方法中间层编码块视频帧多尺度前馈神经网络编码器归一化模块模型训练模块蒸馏数据高时空分辨率电子设备

系统为您推荐了相关专利信息

一种三级别交互融合的图相似性学习方法

相似性学习方法多头注意力机制节点特征前馈神经网络矩阵

多目标优化下的测绘区域态势推演方法及系统

测绘设备三维地理场景异构地理信息地理国情普查遥感影像数据

基于无人机巡检的违规占道识别方法

识别方法图像多尺度语义特征无人机巡检网络

针对冠心病患者主诉数据的命名实体识别方法、系统及介质

命名实体识别方法分类神经网络分类网络患者数据

一种基于虚拟现实与人工智能的轨道交通工程仿真实训系统

仿真实训系统轨道交通工程虚拟现实场景分析模块地铁车站施工

一种模型训练方法、装置、电子设备和存储介质

站点导航

APP 下载