摘要
本发明涉及生成式人工智能技术领域,公开了一种基于因果微调的个性化文生图模型构建及文生图方法,包括:将多个主体的多个参考图像、文本描述分别进行合并增强得到多个合并增强图像及合并文本描述;利用预设因果解耦算法,从各主体的文本描述、合并文本描述及合并增强图像中分别提取出保护身份的文本表征、身份相关及身份无关的视觉表征;将其输入预设因果推理模型,得到交叉注意力映射图;将交叉注意力映射图与对应主体身份相关的视觉表征对齐。本发明通过主体感知的因果解耦来鉴别主体身份相关的信息和身份无关的信息,保护主体身份信息,通过交叉注意力引导使每个主体的文本属性与视觉属性因果对齐,避免主体间混淆文生图的有效性、可控性。
技术关键词
身份
视觉
注意力
模型构建方法
解耦算法
图像编码器
预训练模型
计算机
模型构建系统
文本编码器
多层感知器
可读存储介质
保护主体
人工智能技术
模块
存储器
处理器
指令
系统为您推荐了相关专利信息
网络检测方法
图像
网络检测装置
计算机程序产品
图表
防碰撞方法
障碍物
卡尔曼滤波模型
高效编码器
激光雷达
神经网络模型
视频情感识别方法
面部特征
特征提取模块
非易失性存储介质