一种基于潜在一致性模型的无需微调高效拖拽式编辑方法

正文

推荐专利

申请号：CN202410801066

申请日期：2024-06-20

公开号：CN118657860A

公开日期：2024-09-17

类型：发明专利

摘要

本发明公开了一种基于潜在一致性模型的无需微调高效拖拽式编辑方法，包括：设定拖拽点、特征范围，使用变分自编码器将原始图像映射到隐空间并克隆；使用拖拽、控制双流策略保证一致性，去噪过程中拖拽流部分Self‑Attention的Key、Value替换为控制流特征；使用潜在一致性模型自理解力进行拖拽，在拖拽流中对克隆后的隐向量添加高噪声后，将源点附近特征更新到目标区域，用高斯噪声覆盖原始特征区域随后去噪；使用高低噪声交错的循环修正策略，高噪声拖拽后利用低噪声修正；迭代以上步骤，变分自编码器解码输出拖拽完成图像，并通过交互界面展示给用户。本发明旨在解决自然语言难以对图像的空间属性进行细粒度控制的图像编辑挑战，同时兼顾拖拽速度与图像生成质量。

技术关键词

编辑方法噪声预测文本编码器界面低噪声双线性插值坐标算法图像编码图像重建随机噪声标记器参数自然语言模块解码器

系统为您推荐了相关专利信息

一种阀门

阀门行程人机交互终端激光位移传感器通信模块微处理器

一种基于安防运维平台的绩效考核方法及系统

样本指标绩效考核方法运维平台决策树模型

一种可穿戴坐姿监测和矫正系统及其实现方法

矫正系统柔性力学传感器识别坐姿分析模块连体衣

一种可视化的数据库分析方法及系统

数据库分析方法服务器展示界面接收前端数据库分析技术

一种有限元建模方法及设备

有限元建模方法脚本逻辑语义校验规则

一种基于潜在一致性模型的无需微调高效拖拽式编辑方法

站点导航

APP 下载