一种基于多方协同注意力机制的主题图像编辑与生成方法及其系统

正文

推荐专利

申请号：CN202411509319

申请日期：2024-10-28

公开号：CN119444637A

公开日期：2025-02-14

类型：发明专利

摘要

本申请公开了一种基于多方协同注意力机制的主题图像编辑与生成方法，方法包括：输入多模态指令至主题定位模块，定位作用区域，并在作用区域内提取主题图像和目标图像；将主题图像及目标图像输入预训练的深度学习模型，在自注意层内执行自注意力局部查询，实现整合源图像的背景和主题图像的前景；并执行自注意力全局注入，实现目标图像的细节增强；结合自注意力局部查询及自注意力全局注入的结果，输出编辑和生成的目标图像。本发明极大减少主题类模型生成一致性图像所需的时间，促进其在更广范围内的实际应用。

技术关键词

协同注意力图像生成方法深度学习模型定位模块机制多模态编辑生成系统定位框主题特征控制模块处理器矩阵指令重构可读存储介质存储器

系统为您推荐了相关专利信息

一种针对水环境污染的监测预警方法、装置及存储介质

监测点节点风险预测模型监测预警方法关系

基于瓜蓟马唾液蛋白作用的植物种植质量评估方法及系统

轮廓特征唾液模糊C均值聚类算法蛋白颜色

一种林草火线实时提取方法

无人机影像深度神经网络技术图像格式转换控制终端

一种电催化基的准原位三维元素分析方法

元素分析方法三维重构模型迭代重建技术结构纳米材料原位

零件表面检测光源控制方法、系统、存储介质及程序产品

光源设备光源控制方法零件眼动追踪设备图片

一种基于多方协同注意力机制的主题图像编辑与生成方法及其系统

站点导航

APP 下载