基于长序列图像编码器的视频推理方法

正文

推荐专利

基于长序列图像编码器的视频推理方法

申请号：CN202510608354

申请日期：2025-05-13

公开号：CN120526348A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种基于长序列图像编码器的视频推理方法，属于计算机视觉领域，包括以下步骤：构建基于专家自主网络层AoE、密集型可学习残差连接、混合注意力的长序列图像编码器并进行训练；使用训练后的长序列图像编码器对视频编码器进行初始化，并进一步训练视频编码器；训练视频思维链推理模型，得到训练好的视频思维链推理模型；基于训练好的视频思维链推理模型进行视频推理。本发明可有效降低计算复杂度，提高图像特征提取效率和视频推理准确性，减少对采样技术依赖，提升模型可用性与安全性。

技术关键词

图像编码器推理方法视频编码器注意力序列更新模型参数样本适配器强化学习方法图像特征提取打包技术掩码矩阵蒸馏方法采样技术计算机视觉

基于长序列图像编码器的视频推理方法

站点导航

APP 下载