摘要
本申请公开了一种数据标注方法、装置、电子设备、存储介质及程序产品,涉及计算机数据处理技术领域,该方法包括:对待处理视频进行标注,构建包含至少一个数据对的数据集合,所述数据对包括文本描述和视频帧;将所述数据集合分为第一数据对集合和第二数据对集合;其中,所述第一数据对集合包含的数据对中文本描述和视频帧之间的语义一致,所述第二数据对集合包含的数据对中文本描述和视频帧之间的语义不一致;为所述第二数据对集合包含的视频帧增加相应的文本描述,得到第三数据对集合;将所述第一数据对集合和所述第三数据对集合确定为标注数据。本申请能够提高文生图模型中训练数据的描述文本和图片在语义上的对齐度,实现跨模态语义一致。
技术关键词
文本
数据标注方法
视频帧集合
语义
图像
电子设备
处理器
存储计算机程序
标注装置
计算机程序产品
节点
跨模态
序列
可读存储介质