一种提升多模态模型细颗粒度判别能力的微调优化方法

正文

推荐专利

申请号：CN202411679953

申请日期：2024-11-22

公开号：CN119692411B

公开日期：2025-12-02

类型：发明专利

摘要

本发明涉及一种提升多模态模型细颗粒度判别能力的微调优化方法，属于人工智能领域。本发明通过对微调阶段的图像编码器通道引入ArcFace的角度边界辅助损失来优化图像和文本的联合表示学习。该方法包括预训练和微调两个阶段，预训练阶段使用在大规模图像‑文本对数据集上进行训练，微调阶段则基于特定领域数据集通过固定文本分支的全部参数和图像分支的多数参数，并在图像分支结合辅助损失函数调整模型参数，从而实现多模态模型对特定细颗粒场景判别能力的优化提升。

技术关键词

多模态图像编码器文本编码器图像特征向量网络结构分支图像检索系统文本特征向量超参数数据标注工具阶段场景标签因子

系统为您推荐了相关专利信息

渲染图的检索分析方法、装置、设备、介质及程序产品

图像特征向量检索分析方法文本特征向量索引字段

一种基于CLIP的低光图像增强方法、系统、终端设备及介质

图像增强网络图像增强方法图像编码器图像增强程序训练集

一种基于大模型的智能异构网络融合优化方法及装置

异构网络数据融合算法跨网络异构网络融合监测网络状态

一种基于图像识别与大数据分析的乳腺癌精准诊疗系统

精准诊疗系统图像特征提取神经网络架构关联规则挖掘算法识别模块

一种基于区块链技术的工业产品无人运输设备诊断方法

区块链技术运输设备设备健康状态诊断方法故障类别

一种提升多模态模型细颗粒度判别能力的微调优化方法

站点导航

APP 下载