一种主题图像生成方法及基于大语言模型的代理框架

正文

推荐专利

申请号：CN202510636068

申请日期：2025-05-16

公开号：CN120163903B

公开日期：2025-07-22

类型：发明专利

摘要

本申请公开了一种主题图像生成方法及基于大语言模型的代理框架。方法包括：在大语言模型中，将与主题相关的关键信息扩展为提示信息；在预训练的文本到图像模型中，基于提示信息和关键信息，生成包含三个颜色通道的候选图像；通过注意力机制提取候选图像中主要元素对应的注意力图；计算注意力图在时间步t、注意力层l下的交叉熵；根据交叉熵，对总时间步T、预训练的文本到图像模型的总注意力层L的注意力图进行加权融合；将融合后的注意力图作为指导信息，预测主题图像的掩模，并进行前景分割，分离出带有透明度通道的主题图像。本申请实现熵基加权融合技术在图像生成的应用，能够有效去除不需要的元素，分离出的主题图像具有更高的精度和质量。

技术关键词

图像生成方法大语言模型主题文本 GrabCut算法透明度掩模注意力机制标记通道元素框架颜色过滤模块采样模块输入模块输出模块

系统为您推荐了相关专利信息

一种基于知识图谱和大语言模型的教师备课辅助方法及相关装置

树状数据结构信息检索图谱多模态数据融合节点

一种用于自主移动机械臂机器人多物体拾取与放置的方法

移动机械臂多物体正向运动学机器人聚类

终端测试方法、装置、设备和存储介质

测试终端终端测试方法数据处理模型协议服务器

图像元素生成方法和装置、电子设备及存储介质

图像生成器元素生成方法编码特征图像编码数据

一种表格事实验证方法、装置、设备、介质及产品

表格验证方法语义特征样本标记

一种主题图像生成方法及基于大语言模型的代理框架

站点导航

APP 下载