摘要
本发明提供一种图像文本联合数据处理方法、设备及介质,包括:获取图像数据和图像对应文本数据,采用pnmix法对图像进行数据增强,得到的第一图像数据集和第一图像对应文本数据集;构建常用颜色词汇表,识别第一图像对应文本数据集,将第一图像对应文本数据集中的颜色词汇与常用颜色词汇表中的颜色对比;若常用颜色词汇表存在相同颜色,将第一图像对应文本数据集中的颜色词汇替换为下划线。以解决现有技术中存在的在跨模态模型的数据训练过程中,由于图像数据与文本数据这两种模态具有不同的表达方式,使得图像的视觉特征在增强后而改变,使得图像与文本出现语义不一致,而导致后续训练的模型在实际应用中的精度下降的技术问题。
技术关键词
数据处理方法
文本
颜色
像素
图像数据集合
归一化算法
视觉特征
处理器通信
电子设备
介质
通道
语义
存储器
指令
精度
系统为您推荐了相关专利信息
硬件时间戳
计算机执行指令
数据处理方法
时间同步
信号
遥感图像重建方法
遥感图像数据
生成网络模型
重建图像数据
对比度
局放检测装置
可视化方法
拓扑特征
图像
卷积神经网络结构