摘要
本发明实施例公开了一种基于大模型特征注入的图像编辑实现方法及系统,所述方法包括:参考特征提取步骤:根据真实的参考图像进行图像反演,获取参考中间特征图;目标特征提取步骤:根据目标文本得到了一张与文本语义相符的目标中间特征图;KL散度计算步骤:利用KL散度计算特征图之间的差异值,根据差异值选择从目标文本提取特征或从参考图像提取特征;图像生成步骤:合并获得的特征,将合并的特征输入大模型推理生成并输出目标图像。本发明通过一种简单高效的方法解决了图像编辑任务中身份一致性保留的问题,本发明拥有更高的图像保真度和文本图像相似性,并且更适合应用在图像编辑领域,对用户有更高的灵活度。
技术关键词
特征提取模块
图像提取特征
反演模型
图像生成模型
文本
随机噪声
语义
身份
系统为您推荐了相关专利信息
RGB传感器
无菌环境
采样瓶
控制单元
模型训练模块
智能问答机器人
多模态信息融合
神经网络对图像
自然语言文本
语音
储层孔隙
辨识装置
多参数
信号采集模块
热中子探测器