基于稳定扩散模型的图像生成处理方法、装置及相关设备

AITNT
正文
推荐专利
基于稳定扩散模型的图像生成处理方法、装置及相关设备
申请号:CN202411512417
申请日期:2024-10-25
公开号:CN119516017A
公开日期:2025-02-25
类型:发明专利
摘要
本申请属于金融科技技术领域,提供了一种图像生成处理方法、装置及相关设备,为了解决传统技术中SD模型不能通过微调高效的适应新生成任务的问题,通过确定生成目标图像所需的文本,并基于包含预设多模态预训练模型与预设第一低秩自适应层的预设第一文本编码器,将文本进行编码,得到文本编码信息,再基于包含预设稳定扩散模型与预设第二低秩自适应层的预设图像生成器,将文本编码信息进行编码,得到图像编码信息,并根据图像编码信息,生成目标图像,得到文本所对应的生成图像,能够通过加强稳定扩散模型在文本语义上的控制能力,实现稳定扩散模型在进行多主题或者复杂主题上的适应性高效微调,有助于高效完成业务的新生成任务需求。
技术关键词
文本编码器 图像生成器 预训练模型 多模态 图像编码器 对抗性 金融科技技术 计算机设备 存储计算机程序 中间层 存储器 处理器 主题 可读存储介质 参数
系统为您推荐了相关专利信息
1
基于多模态医学数据的文本推理方法及系统
文本推理方法 数据 医学 多模态特征 网络特征
2
一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统
振动信号识别 数据识别模型 信号预处理模块 多模态 支持向量机分类
3
基于多模态信息的运功功能康复状态检测方法
状态检测方法 多模态信息 运动学特征 肌电信号特征 识别特征
4
基于知识图谱的患者表征相似识别方法及系统
医疗知识图谱 节点 注意力 识别方法 稀疏编码器
5
基于多模态数据融合与智能算法的全链条食品安全监控方法及系统
食品安全监控方法 多模态数据融合 智能算法 多模态传感器 食品安全监控系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号