使用机器学习模型生成图像的方法、系统、存储介质

正文

推荐专利

申请号：CN202510376397

申请日期：2025-03-27

公开号：CN120726153A

公开日期：2025-09-30

类型：发明专利

摘要

本公开描述了用于使用机器学习模型进行快速个性化图像生成的技术。由机器学习模型的第一子模型生成上下文化的特征。上下文化的特征是基于对象图像和文本提示词生成的。对象图像包括目标对象。文本提示词描绘了目标图像，并且指示以下至少一项：改变目标对象的纹理，或者将目标对象放置在特定上下文中。基于对象图像生成自注意力特征。自注意力特征包含关于目标对象的详细信息。通过机器学习模型的第二子模型，基于上下文化的特征和自注意力特征生成目标图像。第二子模型包括上下文交叉注意力层和对象交叉注意力层。目标图像保持目标对象的身份相关信息。

技术关键词

机器学习模型注意力对象计算机可读指令非暂态计算机可读存储介质文本输出提示词处理器图像嵌入纹理编辑身份流水线序列存储器机制颜色

系统为您推荐了相关专利信息

一种基于提示驱动和对比学习的社交媒体多模态情感分类方法

多模态情感分类方法文本融合特征样本数据

一种基于注意力机制的多模态假新闻检测方法

假新闻检测方法图片文本特征向量注意力机制矩阵

一种基于一维卷积神经网络的TDLAS静脉用药浓度预测方法

一维卷积神经网络浓度预测方法深度学习模型静脉滑动窗口

全景分割与多视觉特征协同的图像描述生成方法

网格特征视觉特征语义特征残差归一化注意力机制

一种工业设备预测性维护方法及系统

工业设备融合多源特征注意力机制编码模块风力发电机组齿轮箱

使用机器学习模型生成图像的方法、系统、存储介质

站点导航

APP 下载