基于模态融合和自进化微调的信息驱动目标分割方法

AITNT
正文
推荐专利
基于模态融合和自进化微调的信息驱动目标分割方法
申请号:CN202410939780
申请日期:2024-07-15
公开号:CN118799576A
公开日期:2024-10-18
类型:发明专利
摘要
本发明公开了一种基于模态融合和自进化微调的信息驱动目标分割方法,首先,引入了一个不需要预训练的模态融合适配器,集成到预训练模型的原始架构中,促进视觉语言编码器之间的交互。模态融合适配器有两个定制模块:(1)空间先验模块,用于捕获中间层特征图的局部语义(空间先验);(2)多模态注意力模块,促进视觉语言模态之间的信息交互。其次,设计了一个轻量级的任务特定解码器用于信息驱动的目标分割,以进一步对齐视觉和语言特征。本发明可以无缝集成到任何预训练的器视觉‑语言模型中增强并与它们的中间特征交互,并能够在只更新1.61%到3.38%的参数的情况下,实现与现有完全微调方法相当的性能。
技术关键词
融合视觉特征 分割方法 适配器 图像编码器 代表 融合多模态特征 阶段 文本编码器 对齐模块 多模态注意力 交叉注意力机制 语言编码器 融合特征
系统为您推荐了相关专利信息
1
一种基于机器学习的高温合金蠕变/热暴露条件预测方法
条件预测方法 高温合金 融合神经网络 组织 图像
2
一种高相似性重复数据清洗方法、系统、设备及介质
数据清洗方法 集群 数据项 大规模文本数据 停用词表
3
一种基于递归神经网络的帧间图像分割方法、装置及介质
递归神经网络 图像分割方法 局部特征信息 时序特征 卷积神经网络提取
4
一种电源适配器故障诊断的方法、装置、设备及存储介质
电源适配器 警报 功耗 元件 电流
5
基于基础模型辅助半监督学习的医学图像分割方法及系统
医学图像分割方法 半监督学习 医学图像分割模型 标记 上采样
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号