摘要
本申请公开了一种多模态数据增强方法、装置、设备及计算机程序产品,涉及数据处理技术领域,包括:获取多模态标注数据集;提取各原始文本数据的文本主体信息,并基于各文本主体信息以及各原始图片数据,得到若干组文本增强数据以及文本增强数据对应的目标内容相似图片;基于各原始图片数据以及各目标内容相似图片,得到若干组图片增强数据;将各文本增强数据与各图片增强数据进行关联组合,生成多模态增强数据集。本申请通过实现结合文本增强和图片增强两阶段相互衔接的数据增强方法,从内容层面对多模态标注数据进行增强,从而解决因图片和文本配对的数据需分别增强图片数据和文本数据,而导致降低数据增强的真实性、准确性以及有效性的问题。
技术关键词
文本
图片
多模态
计算机程序产品
景深
词语
图文
元素
语义
数据处理技术
数据获取模块
处理器
两阶段
存储器
有效性
图谱
关系
垫片
系统为您推荐了相关专利信息
火灾报警信号
消防系统
图像识别技术
识别算法
高清监控摄像头
覆层
参数寻优方法
粉末
机器学习模型
多模态数据库
无线打印方法
无线通信链路
解码控制
文本
无损压缩算法
拥塞控制算法
算法模块
报文
网络设备
初始化算法