一种视频标注生成方法、装置及相关设备

正文

推荐专利

一种视频标注生成方法、装置及相关设备

申请号：CN202411910485

申请日期：2024-12-24

公开号：CN119729146A

公开日期：2025-03-28

类型：发明专利

摘要

本申请提供了一种视频标注生成方法、装置及相关设备，方法包括：将获取的多个原始视频输入训练好的视频标注生成模型中；针对每个原始视频获取其视觉特征；基于视觉特征，获取实体表征、谓语表征和句子表征；将获取的句子表征分为偶数视频帧句子表征和奇数视频帧句子表征，并根据偶数视频帧句子表征和奇数视频帧句子表征采用对比学习的方式进行相似度矩阵监督；对各个原始视频的输出特征进行整合并获取用于生成字幕的聚合特征。本申请设计了三种视频编码器对时序细节和空间信息进行建模，这有助于从不同角度和粒度捕捉视频帧的特征，增强帧间信息的提取，避免帧间信息内容提取不充分。

技术关键词

视频帧视觉特征运动特征生成方法上下文特征实体输出特征生成字幕 BiLSTM模型计算机程序产品注意力机制解码模块采样模块视频编码器处理器矩阵物体电子设备

系统为您推荐了相关专利信息

一种舰船综合电力系统配电网络遍历路径的生成方法和装置

综合电力系统节点配电网络生成方法供电路径分析

一种基于生成对抗网络的风力发电场景生成系统及方法

生成对抗网络模型场景生成系统风力发电场遗传算法风机

小麦收割导航路径生成方法及自动收割机

导航路径生成方法三维地理坐标自动收割机网格特征三维点云数据

一种基于多模态信息融合的个性化数字装置训练生成方法

多模态信息融合数字装置场景生成方法策略

页面生成方法、装置、计算机设备及存储介质

样式页面生成方法动态计算机可读指令标签特征

一种视频标注生成方法、装置及相关设备

站点导航

APP 下载