摘要
本发明在计算机视觉技术领域,公开了一种图像处理方法、装置、设备及可读存储介质,该方法包括:获取图像数据集;对原始图像中的结构化信息进行识别,得到结构化数据;利用结构化数据进行自然语言描述生成处理,得到描述文本;将原始图像与对应的描述文本进行关联,得到与原始图像对应的图文样本;利用若干个原始图像对应的图文样本,构建图文数据集。在本发明中,并不需要设计提示语,而是直接从原始图像提取出结构化数据,然后基于结构化数据进行描述文本生成,如此,便可不再受限于提示语设计以及相关模型的限制,可以有效提升图文数据集可靠性。技术效果:能够构建可靠的图文数据集,为基于图文数据集的后续应用打下坚实的基础。
技术关键词
文本生成模型
图文
图像处理方法
自然语言
数据
图像处理模型
词语
可视化界面
样本
对象识别
计算机视觉技术
图像处理装置
图像获取模块
可读存储介质
存储计算机程序
分词
计算机程序产品
标签
系统为您推荐了相关专利信息
语音交互模块
AI语音
充电管理模块
充电宝
控制系统
智能调度方法
深度强化学习算法
时延
任务调度
服务器
地下水超采区
水位预警方法
预警模型
地下水水位变化
神经网络参数
联合决策方法
实用拜占庭容错算法
PBFT算法
多传感器融合
机器学习模型