一种多模态预训练的指向性分割方法

正文

推荐专利

一种多模态预训练的指向性分割方法

申请号：CN202411712663

申请日期：2024-11-27

公开号：CN119579898A

公开日期：2025-03-07

类型：发明专利

摘要

本发明属于深度学习技术在计算机视觉领域，公开一种多模态预训练的指向性分割方法。该方法采用冻结的对比语言图像预训练模型构建整体架构，包括样本初始化、语言编码器、视觉编码器和多图特征加权融合模块，协同实现对图像中指定对象的精确分割。样本初始化模块生成正负样本的文本描述，通过否定词、改变介词和利用大语言模型生成新句子来排除干扰物，确保模型的准确性。图像通过视觉编码器处理，提取深层次特征并进行不完整的反向传播，确保模型参数冻结。最后，在多图特征加权融合模块中，将正负文本特征及多层次特征融合，形成统一特征表示，指导图像分割。该方法有效提升了模型对关键区域和关键对象的理解能力，增强了分割效果。

技术关键词

特征加权融合语言编码器视觉特征样本文本图像分割分割方法中间层前馈神经网络注意力机制多层次特征融合模块多模态上采样输出特征融合特征

系统为您推荐了相关专利信息

基于U-Net网络的埋地目标探测与参数反演方法

参数反演方法网络回波混凝土含水量反演模型

一种联合SEC-LDI法筛选的血浆外泌体质谱代谢指纹及应用

肿瘤分子诊断技术体外诊断标志物前列腺癌标志物前列腺增生患者样本

基于机器学习的文本分类算法优化方法

文本分类算法超参数数据可视化工具预训练模型

一种基于知识图谱的数字人持续对话与记忆增强的方法

图谱记忆语义向量节点自然语言

钻探数据智能分析系统及方法

钻探工作数据智能分析方法故障预测模型钻探设备环境特征值

一种多模态预训练的指向性分割方法

站点导航

APP 下载