摘要
本申请公开了一种图像编辑方法及相关装置,涉及图像处理技术领域,图像编辑方法包括:获取原始图像以及针对原始图像的编辑指令;利用多模态大语言模型,根据原始图像以及编辑指令,获取原始图像对应的目标图像的视觉特征信息;将原始图像对应的目标图像的视觉特征信息处理成用于引导图像编辑的条件嵌入;利用图像编辑模型,在条件嵌入的引导下,对原始图像进行编辑,得到编辑后图像。本申请提供的图像编辑方法,向图像编辑模型引入了由多模态大语言模型获取的视觉特征信息转化而来的条件嵌入,由于该条件嵌入能够为编辑过程提供准确而丰富的引导信息,因此,在条件嵌入的引导下对原始图像进行编辑可获得效果较好的编辑后图像。
技术关键词
图像编辑方法
视觉特征信息
大语言模型
图像视觉特征
文本
多模态
信息处理
计算机可读指令
电子设备
图像嵌入
图像编辑装置
数据获取模块
解码器
计算机存储介质
系统为您推荐了相关专利信息
舞台灯
智能控制方法
矫正方法
光传感器阵列
语音指令识别
场景语义分割方法
文本编码器
图像编码器
语义层次结构
细粒度特征
语言模型生成方法
高维向量空间
文本
依存句法
语义角色标注
信息资源共享系统
数据储存模块
数据读取模块
子模块
数据输入模块