一种基于语义一致性和风格多样性的域泛化语义分割方法

正文

推荐专利

申请号：CN202510093896

申请日期：2025-01-21

公开号：CN120014272A

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于语义一致性和风格多样性的域泛化语义分割方法，包括以下步骤：S1、基于CLIP视觉编码器和文本编码器进行视觉和文本特征提取；S2、基于语义查询增强器利用图文模态间的语义一致性，建立跨模态语义关联并聚合相关语义特征以增强初始对象查询；S3、基于文本驱动的风格变换模块利用文本嵌入差异，引导图像特征低频幅度谱的变换；S4、通过协同加权风格对比损失和风格聚合损失，加强领域间特征的分离和领域内特征的聚合；S5、基于掩码解码器使用语义查询逐层进行掩码预测、类别预测和查询细化；该方法在各个跨域数据集上实现了显著优于现有方法的最佳性能，同时保持模型的训练开销低、推理速度快，具有显著的实用价值和应用前景。

技术关键词

语义分割方法风格文本编码器图像索引视觉特征提取语义特征解码器双曲正切函数像素跨模态全局平均池化注意力多尺度特征特征提取器多层感知机对象

系统为您推荐了相关专利信息

一种考虑头部关键点位置安全帽规范佩戴识别方法及系统

佩戴识别方法佩戴安全帽人体关键点相互位置识别算法

基于改进Josephus变换和骑士巡游联合置乱的混沌图像加密方法

混沌图像加密方法像素矩阵混沌伪随机序列忆阻混沌系统棋盘

一种低剂量CT重建方法及装置

低剂量CT图像深度学习网络 CT重建方法多尺度上采样

一种基于人工智能的视频剪辑优化方法及系统

媒体资产管理智能镜头前端模块语义场景特征数据库

一种毛笔清洗机喷头运行轨迹控制系统

毛笔清洗机轨迹控制系统神经网络模型数据项图像获取单元

一种基于语义一致性和风格多样性的域泛化语义分割方法

站点导航

APP 下载