基于视觉-文本融合的水下图像增强方法及系统

AITNT
正文
推荐专利
基于视觉-文本融合的水下图像增强方法及系统
申请号:CN202511127097
申请日期:2025-08-13
公开号:CN120634934B
公开日期:2025-10-17
类型:发明专利
摘要
本申请属于水下图像增强技术领域,涉及一种基于视觉‑文本融合的水下图像增强方法及系统,方法的步骤为:构建基于视觉‑文本融合的增强网络;增强网络包括用以对图像进行处理生成增强图像的生成器和用以判定图像是真实图像还是生成器生成图像的判别器,生成器包括高速图像生成扩散模型和基于对比语言‑图像预训练模型的文本编码器,高速图像生成扩散模型中的编码器、U‑net模块、解码器依次顺序连接,文本编码器生成用于U‑net模块调节的文本嵌入;将待增强水下图像输入至增强网络得到水下增强图像。本申请利用高速图像生成扩散模型的推理能力和强大先验知识实现视觉‑文本融合,从而达到高效处理和零样本泛化,稳定性强,确保视觉质量。
技术关键词
水下图像增强方法 颜色直方图 水下图像增强系统 预训练模型 文本编码器 视觉 采样模块 约束生成器 离散小波变换 水下图像增强技术 解码器 通道 网络 积层 图像重建 图像增强模块
系统为您推荐了相关专利信息
1
基于大模型的行业智能运维监管方法、系统、设备及介质
运维监管 卷积神经网络深度学习模型 预训练模型 文本 图像特征提取
2
应急预案处理方法、设备及存储介质
预训练模型 组织 案件 节点 数据查看权限
3
一种基于文本的推荐方法、装置、设备及存储介质
语义意图 交叉注意力机制 辅助编码器 样本 文本编码器
4
语音修复方法、模型训练方法和电子设备
文本特征向量 样本 电子设备 模型训练方法 修复方法
5
一种基于多模态大模型的自适应海岸线边缘检测方法
边缘检测方法 文本编码器 高分辨率遥感图像 融合特征 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号