摘要
一种基于物理感知的语义图像编辑方法及系统,涉及计算机视觉领域,包括:获取待编辑图像及其对应的文本编辑指令,构建光照条件图和材质属性图;构建扩散模型架构PhyS‑EdiT,包括低层物理属性编辑子网络、高层语义编辑子网络和融合优化网络;构建PR‑TIPS合成数据集,采用多阶段渐进式训练策略进行模型训练;利用训练好的模型进行图像生成与编辑。本发明提高了物理属性与语义组合编辑能力,具有光照条件和材质属性的解耦编辑功能,支持文本提示下的语义编辑,保持生成结果与原始场景的语义一致性。本发明通过大规模合成数据训练,可实现对真实图像和合成图像的高质量连续和局部精细化编辑,同时支持像素级别的物理属性调整。
技术关键词
图像编辑方法
语义
物理
网络
多阶段
材质属性参数
深度回归模型
光照
自然语言
图像编辑系统
图像输出模块
粗糙度参数
文本编码器
模型训练模块
指令
数据
融合策略