基于稳定扩散模型的图像生成处理方法、装置及相关设备

正文

推荐专利

申请号：CN202411512417

申请日期：2024-10-25

公开号：CN119516017A

公开日期：2025-02-25

类型：发明专利

摘要

本申请属于金融科技技术领域，提供了一种图像生成处理方法、装置及相关设备，为了解决传统技术中SD模型不能通过微调高效的适应新生成任务的问题，通过确定生成目标图像所需的文本，并基于包含预设多模态预训练模型与预设第一低秩自适应层的预设第一文本编码器，将文本进行编码，得到文本编码信息，再基于包含预设稳定扩散模型与预设第二低秩自适应层的预设图像生成器，将文本编码信息进行编码，得到图像编码信息，并根据图像编码信息，生成目标图像，得到文本所对应的生成图像，能够通过加强稳定扩散模型在文本语义上的控制能力，实现稳定扩散模型在进行多主题或者复杂主题上的适应性高效微调，有助于高效完成业务的新生成任务需求。

技术关键词

文本编码器图像生成器预训练模型多模态图像编码器对抗性金融科技技术计算机设备存储计算机程序中间层存储器处理器主题可读存储介质参数

系统为您推荐了相关专利信息

基于多模态医学数据的文本推理方法及系统

文本推理方法数据医学多模态特征网络特征

一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统

振动信号识别数据识别模型信号预处理模块多模态支持向量机分类

基于多模态信息的运功功能康复状态检测方法

状态检测方法多模态信息运动学特征肌电信号特征识别特征

基于知识图谱的患者表征相似识别方法及系统

医疗知识图谱节点注意力识别方法稀疏编码器

基于多模态数据融合与智能算法的全链条食品安全监控方法及系统

食品安全监控方法多模态数据融合智能算法多模态传感器食品安全监控系统

基于稳定扩散模型的图像生成处理方法、装置及相关设备

站点导航

APP 下载