一种多模态预训练的指向性分割方法

AITNT
正文
推荐专利
一种多模态预训练的指向性分割方法
申请号:CN202411712663
申请日期:2024-11-27
公开号:CN119579898A
公开日期:2025-03-07
类型:发明专利
摘要
本发明属于深度学习技术在计算机视觉领域,公开一种多模态预训练的指向性分割方法。该方法采用冻结的对比语言图像预训练模型构建整体架构,包括样本初始化、语言编码器、视觉编码器和多图特征加权融合模块,协同实现对图像中指定对象的精确分割。样本初始化模块生成正负样本的文本描述,通过否定词、改变介词和利用大语言模型生成新句子来排除干扰物,确保模型的准确性。图像通过视觉编码器处理,提取深层次特征并进行不完整的反向传播,确保模型参数冻结。最后,在多图特征加权融合模块中,将正负文本特征及多层次特征融合,形成统一特征表示,指导图像分割。该方法有效提升了模型对关键区域和关键对象的理解能力,增强了分割效果。
技术关键词
特征加权融合 语言编码器 视觉特征 样本 文本 图像分割 分割方法 中间层 前馈神经网络 注意力机制 多层次特征融合 模块 多模态 上采样 输出特征 融合特征
系统为您推荐了相关专利信息
1
基于U-Net网络的埋地目标探测与参数反演方法
参数反演方法 网络 回波 混凝土含水量 反演模型
2
一种联合SEC-LDI法筛选的血浆外泌体质谱代谢指纹及应用
肿瘤分子诊断技术 体外诊断标志物 前列腺癌标志物 前列腺增生患者 样本
3
基于机器学习的文本分类算法优化方法
文本分类算法 超参数 数据 可视化工具 预训练模型
4
一种基于知识图谱的数字人持续对话与记忆增强的方法
图谱 记忆 语义向量 节点 自然语言
5
钻探数据智能分析系统及方法
钻探工作 数据智能分析方法 故障预测模型 钻探设备 环境特征值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号