摘要
本发明涉及人工智能领域,可应用于金融、医疗领域,本发明公开了图像局部编辑方法、装置、设备及介质,该方法包括获取原始图像、图像待替换位置掩码和提示文本,并获取提示文本对应的词元嵌入;其中,图像待替换位置掩码用于对原始图像的对应位置进行图像编辑;获取与第一扩散模型连接的第二扩散模型所输出的注意力统计向量;将提示文本对应的词元嵌入、注意力统计向量、原始图像及图像待替换位置掩码输入至第一扩散模型,得到与原始图像对应且采用了图像待替换位置掩码编辑的编辑后图像。本发明通过引入注意力平滑结构和知识蒸馏机制,提升了扩散模型在局部图像编辑任务中的一致性与可控性。
技术关键词
注意力
编辑方法
图像获取单元
局部编辑装置
卷积神经网络框架
文本编码器
处理器
可读存储介质
计算机设备
蒸馏
存储器
金融
数据
机制
系统为您推荐了相关专利信息
视网膜图像分层
计算机可执行指令
模型训练方法
训练集
标签
诊断方法
储能电池
电池模组
电池单体温度
注意力机制
学习管理系统
学习终端
计算机视觉算法
身份认证模块
状态监测模块
施工现场
夜间施工照明
位置跟踪
场景
参数检测方法
图像融合方法
编码器
噪声方差
网络结构
噪声图像