基于模态融合和自进化微调的信息驱动目标分割方法

正文

推荐专利

申请号：CN202410939780

申请日期：2024-07-15

公开号：CN118799576A

公开日期：2024-10-18

类型：发明专利

摘要

本发明公开了一种基于模态融合和自进化微调的信息驱动目标分割方法，首先，引入了一个不需要预训练的模态融合适配器，集成到预训练模型的原始架构中，促进视觉语言编码器之间的交互。模态融合适配器有两个定制模块：（1）空间先验模块，用于捕获中间层特征图的局部语义（空间先验）；（2）多模态注意力模块，促进视觉语言模态之间的信息交互。其次，设计了一个轻量级的任务特定解码器用于信息驱动的目标分割，以进一步对齐视觉和语言特征。本发明可以无缝集成到任何预训练的器视觉‑语言模型中增强并与它们的中间特征交互，并能够在只更新1.61%到3.38%的参数的情况下，实现与现有完全微调方法相当的性能。

技术关键词

融合视觉特征分割方法适配器图像编码器代表融合多模态特征阶段文本编码器对齐模块多模态注意力交叉注意力机制语言编码器融合特征

系统为您推荐了相关专利信息

一种基于机器学习的高温合金蠕变/热暴露条件预测方法

条件预测方法高温合金融合神经网络组织图像

一种高相似性重复数据清洗方法、系统、设备及介质

数据清洗方法集群数据项大规模文本数据停用词表

一种基于递归神经网络的帧间图像分割方法、装置及介质

递归神经网络图像分割方法局部特征信息时序特征卷积神经网络提取

一种电源适配器故障诊断的方法、装置、设备及存储介质

电源适配器警报功耗元件电流

基于基础模型辅助半监督学习的医学图像分割方法及系统

医学图像分割方法半监督学习医学图像分割模型标记上采样

基于模态融合和自进化微调的信息驱动目标分割方法

站点导航

APP 下载