摘要
本发明公开了一种基于潜在一致性模型的无需微调高效拖拽式编辑方法,包括:设定拖拽点、特征范围,使用变分自编码器将原始图像映射到隐空间并克隆;使用拖拽、控制双流策略保证一致性,去噪过程中拖拽流部分Self‑Attention的Key、Value替换为控制流特征;使用潜在一致性模型自理解力进行拖拽,在拖拽流中对克隆后的隐向量添加高噪声后,将源点附近特征更新到目标区域,用高斯噪声覆盖原始特征区域随后去噪;使用高低噪声交错的循环修正策略,高噪声拖拽后利用低噪声修正;迭代以上步骤,变分自编码器解码输出拖拽完成图像,并通过交互界面展示给用户。本发明旨在解决自然语言难以对图像的空间属性进行细粒度控制的图像编辑挑战,同时兼顾拖拽速度与图像生成质量。
技术关键词
编辑方法
噪声预测
文本编码器
界面
低噪声
双线性插值
坐标
算法
图像编码
图像重建
随机噪声
标记器
参数
自然语言
模块
解码器
系统为您推荐了相关专利信息
阀门行程
人机交互终端
激光位移传感器
通信模块
微处理器
矫正系统
柔性力学传感器
识别坐姿
分析模块
连体衣
数据库分析方法
服务器
展示界面
接收前端
数据库分析技术