长文本生成图像的模型训练方法、设备及存储介质

正文

推荐专利

申请号：CN202411613422

申请日期：2024-11-12

公开号：CN119559296A

公开日期：2025-03-04

类型：发明专利

摘要

本发明提供了一种长文本生成图像的模型训练方法、设备及存储介质，涉及计算机视觉领域。该方法包括获取训练图像并将训练图像输入预设图生文模型进行描述得到长文本；对长文本进行识别分析得到多个对象；对训练图像逐步进行对象移除得到多个逐步减少对象的中间图像和多个目标图像；将目标图像输入到预设图生文模型中，得到与每个对象对应的短文本；根据对象移除顺序将中间图像和短文本进行匹配生成图像数据对；将图像数据对依次输入预设模型进行迭代训练得到目标模型。通过逐步生成单一对象并与文本句子对应的方式实现对长文本生成的精细控制，避免了长文本一次性生成整幅图像所导致的控制不准确问题，保证了图像生成的逐步性和连贯性。

技术关键词

对象文本生成图像计算机执行指令生成图像数据模型训练方法模型训练设备序列命名实体识别模型可读存储介质计算机视觉处理器通信存储器频率匹配模块分析模块

系统为您推荐了相关专利信息

图像检索方法、装置、电子设备及可读存储介质

文本局部图像特征场景特征计算机程序指令图像检索方法

评论处理方法、装置、设备及介质

文本语义节点字词存储装置

基于虚拟机器人的工作角色模拟方法、系统及虚拟机器人

角色模拟方法机器人项目习惯逻辑

基于联邦学习的语言模型训练方法、装置、设备及介质

压缩语言模型语言模型训练方法适配器模拟器参数

模型训练方法、基于波动误差时变性的伪量测区间预测方法、装置、设备及介质

样本周期预测模型训练方法区间预测方法误差

长文本生成图像的模型训练方法、设备及存储介质

站点导航

APP 下载