摘要
本发明公开了一种基于场景图的文生图大模型提示词优化方法、电子设备、介质,包括:获取第一提示词,解析得到第一场景图;将第一提示词输入至文生图大模型中,生成对应的第一图片;将第一场景图与第一图片进行语义对齐得到第二场景图;将第一提示词以及第二场景图输入至预先训练好的提示词优化模型中,输出第二提示词;包括:对第一提示词进行编码得到文本特征,对第二场景图进行编码、卷积得到语义特征;将文本特征、语义特征拼接后输入至文本编辑解码器,输出至少包括删除、重排、插入在内的动作;基于输出的删除、重排、插入动作对第一提示词进行处理,得到第二提示词。
技术关键词
场景
图片
实体
语义特征
解码器
图文
指标
模态特征
美学
关系
文本
编码
表达式
电子设备
处理器
问答模型
计算机程序产品
存储器
超参数
系统为您推荐了相关专利信息
Actor模型
系统导航方法
全局状态信息
解码器
自动编码方法
云电脑
线性卡尔曼滤波
服务器
运动状态信息
电脑终端