基于证据扩散模型的文本到图像多目标生成方法及系统

正文

推荐专利

申请号：CN202511110419

申请日期：2025-08-08

公开号：CN120976348A

公开日期：2025-11-18

类型：发明专利

摘要

本公开提供了基于证据扩散模型的文本到图像多目标生成方法及系统，涉及文生图技术领域，包括：获取文本提示语；将预处理后的文本提示语输入证据扩散模型后，首先提取名词交叉注意图，将名词交叉注意图输入至多层感知机证据网络，通过非线性变换将其映射到证据空间，输出每个像素关于各语义类别的证据值，构建狄利克雷分布，并引入像素证据损失对狄利克雷分布进行优化；使用D‑S证据理论将所有名词交叉注意力图转换为基本信念分配函数，基于基本信念分配函数计算名词交叉注意图重叠区域的冲突系数，构建Token冲突损失，联合优化计算像素证据损失、Token冲突损失以及模型自身损失，直至生成图像。本公开提升了多目标图像生成的准确性与逻辑一致性。

技术关键词

生成方法文本非暂态计算机可读存储介质多层感知机图像注意力像素语义随机噪声网络非线性电子设备理论处理器存储器计算机程序产品对象基础生成系统

系统为您推荐了相关专利信息

考后分析报告的智能化生成方法及系统

多模态深度学习答题报告生成方法试卷

一种基于机器人3D视觉的抓件系统

视觉系统识别系统 PLC控制器调节组件空间位置关系

一种基于原型动态伪标签的黄斑水肿病变筛查方法及系统

解码器原型标签分支筛查方法

一种基于反射式全息图的音乐夜灯

音乐夜灯全息图灯光模块全息三维显示控制芯片

基于图文对比辅助学习的人脸反欺诈模型训练方法及装置

反欺诈模型识别人脸图像预训练模型图像编码器样本

基于证据扩散模型的文本到图像多目标生成方法及系统

站点导航

APP 下载