摘要
本发明公开了使用扩散进行合成图像增强的上下文保留。本文提出的方法旨在生成合成图像,其中一个或更多个增强被逼真地添加到图像中的对象,同时确保图像内的语义或上下文信息的保留和完整性。合成增强系统可以识别和提取前景图像数据(例如,文本),并且可以由生成扩散模型处理去除了前景图像数据的图像版本。可以提供一个或更多个输入以指定诸如要执行的增强的类型或强度之类的方面。在使用生成扩散模型生成经增强图像之后,可以将先前去除的文本混合回图像中。合成增强系统可以对文本使用一个或更多个混合权重,例如缺陷混合权重和字母混合权重。最终结果是具有所添加的逼真增强的合成图像,该合成图像保留了语义内容。
技术关键词
文本
像素
对象
光学字符识别
处理器
语义
协作内容
纹理
大语言模型
计算机
数字孪生
图像增强
数据中心
资产
电路
平台
字母
强度
系统为您推荐了相关专利信息
数据集制作方法
视野
多模态
文本
计算机可执行指令
知识共享系统
通用特征
数据收集模块
模块通信
差分隐私
电网系统
设备运行状态
自动校核方法
实时数据处理
数据处理框架