摘要
本申请公开了一种图文数据集的构造方法、系统、设备、存储介质及产品,涉及文本处理技术领域,包括:基于各个原始图像各自对应的原始文本,提取实体、实体属性和实体间关系,并基于实体、实体属性和实体间关系构建前景特征知识库;提取各原始文本中的背景描述样本,并基于背景描述样本构建背景特征知识库;基于前景特征知识库和背景特征知识库构造文本,得到目标提示文本;利用目标提示文本生成相应的目标图像,并基于目标图像和相应的目标提示文本形成图文对,以用于构建图文数据集。本申请技术方案旨在解决如何构造出文本质量较高的文生图模型提示文本,以便构造出质量较高的图文数据集的技术问题。
技术关键词
大语言模型
实体间关系
图文
知识库构造
词语
图像
数据
构造系统
计算机程序产品
视觉特征
文本处理技术
样本
预训练模型
处理器
语义
模块
电子设备
系统为您推荐了相关专利信息
自动评分系统
数据处理模块
文本分类模型
中文分词
中文文本分词
大语言模型
实体
生成知识图谱
关系
构建知识图谱
词语
网络风险预警方法
神经网络模型
文本
交互动作