一种面向视觉和语言模型的统一提示学习方法

正文

推荐专利

申请号：CN202511010846

申请日期：2025-07-22

公开号：CN120911411A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了一种面向视觉和语言模型的统一提示学习方法。本发明步骤：步骤1：定义统一的模态无关提示；步骤2：使用轻量级Transformer层转换统一提示；步骤3：将转换后的提示分别输入到文本编码器和视觉编码器；步骤4：在下游任务训练中仅优化统一提示和轻量级Transformer层；步骤5：通过联合优化实现更可靠的预测。本发明简化了视觉‑语言模型的适应性学习流程，提高了模型在少量样本学习和领域泛化任务上的性能。

技术关键词

学习方法文本编码器视觉图像编码器预训练模型注意力定义网络层级参数样本模块

系统为您推荐了相关专利信息

一种全天候桥梁结构位移测量方法

Hessian矩阵特征点图像采集设备基准特征桥梁结构

一种基于可靠性样本选择的网络入侵检测方法及系统

网络入侵检测方法样本注意力模型网络入侵检测系统标签

一种小样本医学图像分类方法、系统、装置及存储介质

医学图像分类方法原型医学图像分割序列重叠切片

罐体码垛补料联动控制方法

联动控制方法分布式传感器网络罐体模糊控制规则视觉识别传感器

一种基于多模态大模型的应急态势理解系统、方法及存储介质

理解系统多模态数据采集多模态特征融合强化学习算法非临时性存储介质

一种面向视觉和语言模型的统一提示学习方法

站点导航

APP 下载