视频的标注方法、装置、存储介质及设备

正文

推荐专利

视频的标注方法、装置、存储介质及设备

申请号：CN202411137592

申请日期：2024-08-19

公开号：CN119052599A

公开日期：2024-11-29

类型：发明专利

摘要

本申请公开了一种视频的标注方法、装置、存储介质及设备，属于深度学习技术领域。方法包括：获取待标注的视频和用户提示词；利用OVSeg模型提取视频中的物体的特征信息、类别信息和位置信息；从视频中提取视频关键帧，利用图神经网络根据视频关键帧和各个物体的特征信息构建图结构的节点，根据视频关键帧中各个物体的类别关系、空间位置关系和时间关系构建图结构的边，根据图结构将视频划分为多个视频片段；对于每个视频片段，根据视频片段中物体的类别信息和用户提示词生成领域提示词；利用多模态模型根据用户提示词、领域提示词和对应的视频片段生成视频片段的文本描述。本申请能提高标注的质量和效率，提高标注的灵活性和适应性。

技术关键词

关键帧标注方法空间位置关系物体文本多模态标注装置生成视频片段节点融合特征计算机设备关注点深度学习技术标签视频帧语义模块可读存储介质

系统为您推荐了相关专利信息

基于大语言模型的径流预测方法和系统

径流预测方法深度学习模型大语言模型生成可执行代码水文

一种运营商OLT故障处理场景中的意图识别方法及系统

意图识别方法 Softmax分类器故障场景局部敏感哈希健康状态数据

一种脑电与图片联合编码实现手部精细动作运动想象的方法

脑电信号采集设备编码器图片解码器运动

一种坡口类零件划线刀具的加工路径规划方法及系统

划线刀具路径规划方法零件轮廓坡口参数

一种基于多模态语言对齐的数据增强方法和装置

图像嵌入文本多模态编码器图像数据编码模块

视频的标注方法、装置、存储介质及设备

站点导航

APP 下载