文生图场景下的模型训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202411698709

申请日期：2024-11-25

公开号：CN119648827A

公开日期：2025-03-18

类型：发明专利

摘要

本公开提供了一种文生图场景下的模型训练方法、装置、设备及介质，属于人工智能领域。该方法包括：构建多个图文样本对；对多个图文样本对中包括的原始文本进行数据扰动，得到编辑文本；对编辑文本和多个图文样本对中包括的原始文本进行文本特征提取，得到编辑文本的第一文本特征和多个图文样本对的第二文本特征；对多个图文样本对中包括的图像进行图像特征提取，得到多个图文样本对的图像特征；以学习文本与图像之间的相关性以及文本与文本之间的相关性为目标，基于第一文本特征、第二文本特征和图像特征进行模型训练，得到文生图场景下用于执行文本编码的模型。本公开确保了文生图任务中基于语义相近的文本能够生成相似的图像。

技术关键词

文本模型训练方法图文编辑样本场景图像特征提取矩阵特征提取模块语义电子设备标签元素可执行程序代码模型训练装置处理器可读存储介质编码计算机程序产品

系统为您推荐了相关专利信息

一种化工故障的检测方法、系统、智能终端及存储介质

故障检测模型偏差历史运行数据化工预测误差

一种天然气管网状态参数预测方法、装置、设备及介质

站点天然气管网系统特征提取模型矩阵时序预测模型

图像检索方法、电子设备、计算机可读介质及计算机程序产品

图像检索方法图像编码计算机程序产品语句文本

一种依托大模型技术提升政务数据治理效率的方法

建设智能政务大数据平台主题自然语言目录

一种机器人报修场景的时间标准化方法

标准化方法日期语义关键词机器人多轮对话

文生图场景下的模型训练方法、装置、设备及介质

站点导航

APP 下载