一种基于多模态条件适配的图片编辑方法及系统

正文

推荐专利

申请号：CN202510178971

申请日期：2025-02-18

公开号：CN120032021B

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供一种基于多模态条件适配的图片编辑方法及系统，本发明基于多模态条件适配的图片编辑方法包括，第一文本向量获取步骤：经过处理得到与图片对应的图片描述，将该图片描述经过编辑器处理，获取基于图片信息的第一文本向量；第二文本向量获取步骤：对用于的编辑指令处理，得到基于该编辑指令的第二文本向量；融合特征获取步骤：通过权重融合第一文本向量和第二文本向量，得到融合特征；图像潜在特征编码获取步骤；图像编辑步骤：接收注入的条件信息，同时对接收到的图片潜在特征和潜在噪声去噪，接收条件信息的引导在迭代去噪过程中逐步生成用户想要的图像；图像还原步骤。本发明能够提升图像编辑的稳定性、可控性及准确度。

技术关键词

图片编辑方法融合特征噪声多模态图像编码器交叉注意力机制元素文本编码器图像还原图像解码器生成用户图片编辑系统指令文本特征向量图像特征向量

系统为您推荐了相关专利信息

多模态检索模型的训练方法、多模态检索方法及装置

文本多模态检索方法训练集图片训练样本集

基于多模态数据融合的呼吸训练装置

情绪特征数据处理服务器生理多模态传感器多模态数据融合

一种基于多模态融合的钓鱼网站检测方法及系统

钓鱼网站检测方法钓鱼网站检测系统文本特征向量图像特征向量信息数据处理终端

一种基于生成式模型的自动混剪视频的方法

文本序列视频解码视频库计算误差

一种基于融资项目的财务测算系统及方法

项目风险评估报告可视化界面风险评估模型数据分析技术

一种基于多模态条件适配的图片编辑方法及系统

站点导航

APP 下载