结合多实例采样器机制的图像生成方法、装置及设备

正文

推荐专利

申请号：CN202510848549

申请日期：2025-06-23

公开号：CN120746832A

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及人工智能技术领域，本方案可应用于金融、医疗领域，本发明提供一种结合多实例采样器机制的图像生成方法、装置及设备，方法包括：从图像数据中获取初始噪声图像；其中，图像数据包括多个实例；根据各实例的空间条件信息确定每个实例在所述初始噪声图像中的位置信息后，生成对应的定位框；其中，实例与对应框一一对应；通过多实例扩散模型对所述初始噪声图像及各所述定位框并行执行预设步数反向去噪，输出多实例扩散结果；结合所述初始噪声图像及所述多实例扩散结果，生成高分辨率图像。本发明实施例通过独立处理每个实例的去噪过程，有效避免不同对象间的特征干扰，从而确保关键细节的清晰表达，最终高效生成高保真度的多实例图像。

技术关键词

多实例噪声图像图像生成方法定位框采样器生成高分辨率残差预测机制文本图像生成装置处理器人工智能技术数据语义样本可读存储介质存储器电子设备

系统为您推荐了相关专利信息

一种基于YOLO算法的轻量化检测方法

YOLO算法网络结构注意力卷积模块归一化方法

基于文本的图像生成方法、装置、设备及存储介质

动态卷积神经网络节点文本特征向量图像生成方法图像生成模型

一种OCT图像噪声去除方法

神经网络模型序列噪声图像数据像素排列

一种噪声环境下基于语音和面部表情的智能情感识别方法

情感识别方法融合特征音频特征编码器结构无监督

多模态引导的渐进式图像生成方法

图像生成方法约束特征注意力多模态对象

结合多实例采样器机制的图像生成方法、装置及设备

站点导航

APP 下载