一种图像文本联合数据处理方法、设备及介质

AITNT
正文
推荐专利
一种图像文本联合数据处理方法、设备及介质
申请号:CN202410855217
申请日期:2024-06-28
公开号:CN118708750A
公开日期:2024-09-27
类型:发明专利
摘要
本发明提供一种图像文本联合数据处理方法、设备及介质,包括:获取图像数据和图像对应文本数据,采用pnmix法对图像进行数据增强,得到的第一图像数据集和第一图像对应文本数据集;构建常用颜色词汇表,识别第一图像对应文本数据集,将第一图像对应文本数据集中的颜色词汇与常用颜色词汇表中的颜色对比;若常用颜色词汇表存在相同颜色,将第一图像对应文本数据集中的颜色词汇替换为下划线。以解决现有技术中存在的在跨模态模型的数据训练过程中,由于图像数据与文本数据这两种模态具有不同的表达方式,使得图像的视觉特征在增强后而改变,使得图像与文本出现语义不一致,而导致后续训练的模型在实际应用中的精度下降的技术问题。
技术关键词
数据处理方法 文本 颜色 像素 图像数据集合 归一化算法 视觉特征 处理器通信 电子设备 介质 通道 语义 存储器 指令 精度
系统为您推荐了相关专利信息
1
数据处理方法、系统、电子设备、存储介质及机器人
硬件时间戳 计算机执行指令 数据处理方法 时间同步 信号
2
一种遥感图像重建方法、系统、装置、介质
遥感图像重建方法 遥感图像数据 生成网络模型 重建图像数据 对比度
3
帧内模式决策系统及方法
电路模块 多尺寸 模式决策方法 节点 决策系统
4
一种基于中医面部分区的痘痘识别方法
面部 人脸 识别方法 类间方差 深度学习语义分割
5
一种在线局放检测装置中局放原始信号的可视化方法
局放检测装置 可视化方法 拓扑特征 图像 卷积神经网络结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号