摘要
本说明书实施例提供了图标生成和图标生成模型训练方法、装置、设备及介质。其中,图标生成方法包括:获取用户输入的风格参考图标以及文本描述信息;将风格参考图标输入至图像提示适配器,得到风格特征向量;将文本描述信息输入至稳定扩散模型的文本编码器,得到文本特征向量;将风格特征向量以及文本特征向量输入至稳定扩散模型的U‑Net模块,得到U‑Net模块输出的图标预测向量;对图标预测向量进行解析,得到与文本描述信息的内容一致的至少一个目标图标;目标图标的风格与风格参考图标的风格一致。从而可以生成高质量且满足用户个性化需求的图标。
技术关键词
适配器
文本特征向量
风格
图像编码器
图标生成方法
文本编码器
计算机可执行指令
生成模型训练方法
注意力
特征值
图标生成装置
输入模块
自然语言模型
线条
处理器
系统为您推荐了相关专利信息
多模态特征融合
图像嵌入
强化学习模型
深度神经网络模型
图像检索方法