摘要
本发明实施例公开了一种图像编辑与生成方法、装置、电子设备及存储介质,涉及图像生成技术领域,其中,所述方法包括:获取待处理图像和目标指令,根据待处理图像中的场景构建待处理图像的图像描述,将图像描述转化为文本标记,通过嵌入模型将文本标记嵌入到高维空间中得到文本嵌入,通过扩散模型根据待处理图像和文本嵌入得到待处理图像的l atent向量,根据目标指令设计编辑算子,使用编辑算子更新l atent向量,通过扩散模型根据更新后的Latent向量生成结果图像。本发明通过结合扩散模型和编辑算子实现了对图像的高效、精确和灵活编辑,解决了现有技术无法提升模型在特定目标类别上的表现、不能解决长尾分布问题以及无法生成与真实场景相近的数据的问题。
技术关键词
生成方法
编辑
计算机可读指令
标记
图像生成技术
交叉注意力机制
电子设备
场景
文本编码器
图像处理模块
色彩校正
噪声图像
标注工具
传播算法
生成装置
处理器
语义
系统为您推荐了相关专利信息
监测环境参数
监测点
温湿度智能调控
畜牧养殖环境
指标