摘要
本发明提供一种文本辅助的反光去除方法,包括:输入数据编码、迭代优化控制条件、多条件引导机制和去噪过程4个步骤,每个步骤均通过神经网络中相应设计的模块来实现;通过文本辅助提供语义信息进行反光去除,大大提升实际使用的便利性,并使反光去除的效果超过以往的单张图像的方法;对于扩散模型中遇到的不准确的初始控制条件,能在迭代中进行优化,让扩散模型去除反光后恢复出的背景层保证颜色和结构上的准确性,并且能处理复杂困难的反光场景,如低背景可见度或饱和反光的情况;构建的带有文本提示的数据集,适用文本辅助的反光去除方法的训练和测试,本方法设计科学合理,简单可靠,适合推广。
技术关键词
文本编码器
解码网络
颜色
数据编码
噪声预测
图像
伽马校正
反光层
结构编码器
多尺度特征
机制
带反光
场景
传播算法
系统为您推荐了相关专利信息
服饰搭配推荐方法
模特
视觉特征
多模态特征融合
文本编码器
面部特征信息
训练图像数据
数据录入方法
对象追踪
颜色
卫星遥感影像
语义理解模型
图文检索方法
跨模态
多尺度