一种基于多模态条件适配的图片编辑方法及系统

AITNT
正文
推荐专利
一种基于多模态条件适配的图片编辑方法及系统
申请号:CN202510178971
申请日期:2025-02-18
公开号:CN120032021B
公开日期:2025-10-28
类型:发明专利
摘要
本发明提供一种基于多模态条件适配的图片编辑方法及系统,本发明基于多模态条件适配的图片编辑方法包括,第一文本向量获取步骤:经过处理得到与图片对应的图片描述,将该图片描述经过编辑器处理,获取基于图片信息的第一文本向量;第二文本向量获取步骤:对用于的编辑指令处理,得到基于该编辑指令的第二文本向量;融合特征获取步骤:通过权重融合第一文本向量和第二文本向量,得到融合特征;图像潜在特征编码获取步骤;图像编辑步骤:接收注入的条件信息,同时对接收到的图片潜在特征和潜在噪声去噪,接收条件信息的引导在迭代去噪过程中逐步生成用户想要的图像;图像还原步骤。本发明能够提升图像编辑的稳定性、可控性及准确度。
技术关键词
图片编辑方法 融合特征 噪声 多模态 图像编码器 交叉注意力机制 元素 文本编码器 图像还原 图像解码器 生成用户 图片编辑系统 指令 文本特征向量 图像特征向量
系统为您推荐了相关专利信息
1
多模态检索模型的训练方法、多模态检索方法及装置
文本 多模态检索方法 训练集 图片 训练样本集
2
基于多模态数据融合的呼吸训练装置
情绪特征 数据处理服务器 生理 多模态传感器 多模态数据融合
3
一种基于多模态融合的钓鱼网站检测方法及系统
钓鱼网站检测方法 钓鱼网站检测系统 文本特征向量 图像特征向量 信息数据处理终端
4
一种基于生成式模型的自动混剪视频的方法
文本 序列 视频解码 视频库 计算误差
5
一种基于融资项目的财务测算系统及方法
项目 风险评估报告 可视化界面 风险评估模型 数据分析技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号