视频的标注方法、装置、存储介质及设备

AITNT
正文
推荐专利
视频的标注方法、装置、存储介质及设备
申请号:CN202411137592
申请日期:2024-08-19
公开号:CN119052599A
公开日期:2024-11-29
类型:发明专利
摘要
本申请公开了一种视频的标注方法、装置、存储介质及设备,属于深度学习技术领域。方法包括:获取待标注的视频和用户提示词;利用OVSeg模型提取视频中的物体的特征信息、类别信息和位置信息;从视频中提取视频关键帧,利用图神经网络根据视频关键帧和各个物体的特征信息构建图结构的节点,根据视频关键帧中各个物体的类别关系、空间位置关系和时间关系构建图结构的边,根据图结构将视频划分为多个视频片段;对于每个视频片段,根据视频片段中物体的类别信息和用户提示词生成领域提示词;利用多模态模型根据用户提示词、领域提示词和对应的视频片段生成视频片段的文本描述。本申请能提高标注的质量和效率,提高标注的灵活性和适应性。
技术关键词
关键帧 标注方法 空间位置关系 物体 文本 多模态 标注装置 生成视频片段 节点 融合特征 计算机设备 关注点 深度学习技术 标签 视频帧 语义 模块 可读存储介质
系统为您推荐了相关专利信息
1
基于大语言模型的径流预测方法和系统
径流预测方法 深度学习模型 大语言模型 生成可执行代码 水文
2
一种运营商OLT故障处理场景中的意图识别方法及系统
意图识别方法 Softmax分类器 故障场景 局部敏感哈希 健康状态数据
3
一种脑电与图片联合编码实现手部精细动作运动想象的方法
脑电信号采集设备 编码器 图片 解码器 运动
4
一种坡口类零件划线刀具的加工路径规划方法及系统
划线刀具 路径规划方法 零件 轮廓 坡口参数
5
一种基于多模态语言对齐的数据增强方法和装置
图像嵌入 文本 多模态 编码器 图像数据编码模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号