摘要
本发明提供一种基于多模态条件适配的图片编辑方法及系统,本发明基于多模态条件适配的图片编辑方法包括,第一文本向量获取步骤:经过处理得到与图片对应的图片描述,将该图片描述经过编辑器处理,获取基于图片信息的第一文本向量;第二文本向量获取步骤:对用于的编辑指令处理,得到基于该编辑指令的第二文本向量;融合特征获取步骤:通过权重融合第一文本向量和第二文本向量,得到融合特征;图像潜在特征编码获取步骤;图像编辑步骤:接收注入的条件信息,同时对接收到的图片潜在特征和潜在噪声去噪,接收条件信息的引导在迭代去噪过程中逐步生成用户想要的图像;图像还原步骤。本发明能够提升图像编辑的稳定性、可控性及准确度。
技术关键词
图片编辑方法
融合特征
噪声
多模态
图像编码器
交叉注意力机制
元素
文本编码器
图像还原
图像解码器
生成用户
图片编辑系统
指令
文本特征向量
图像特征向量
系统为您推荐了相关专利信息
情绪特征
数据处理服务器
生理
多模态传感器
多模态数据融合
钓鱼网站检测方法
钓鱼网站检测系统
文本特征向量
图像特征向量
信息数据处理终端
项目
风险评估报告
可视化界面
风险评估模型
数据分析技术