摘要
本申请属于水下图像增强技术领域,涉及一种基于视觉‑文本融合的水下图像增强方法及系统,方法的步骤为:构建基于视觉‑文本融合的增强网络;增强网络包括用以对图像进行处理生成增强图像的生成器和用以判定图像是真实图像还是生成器生成图像的判别器,生成器包括高速图像生成扩散模型和基于对比语言‑图像预训练模型的文本编码器,高速图像生成扩散模型中的编码器、U‑net模块、解码器依次顺序连接,文本编码器生成用于U‑net模块调节的文本嵌入;将待增强水下图像输入至增强网络得到水下增强图像。本申请利用高速图像生成扩散模型的推理能力和强大先验知识实现视觉‑文本融合,从而达到高效处理和零样本泛化,稳定性强,确保视觉质量。
技术关键词
水下图像增强方法
颜色直方图
水下图像增强系统
预训练模型
文本编码器
视觉
采样模块
约束生成器
离散小波变换
水下图像增强技术
解码器
通道
网络
积层
图像重建
图像增强模块
系统为您推荐了相关专利信息
运维监管
卷积神经网络深度学习模型
预训练模型
文本
图像特征提取
语义意图
交叉注意力机制
辅助编码器
样本
文本编码器
文本特征向量
样本
电子设备
模型训练方法
修复方法
边缘检测方法
文本编码器
高分辨率遥感图像
融合特征
语义