一种基于自适应文本提示的zero-shot图像识别方法

正文

推荐专利

申请号：CN202411458089

申请日期：2024-10-18

公开号：CN119625481A

公开日期：2025-03-14

类型：发明专利

摘要

尽管大规模预训练模型在自然语言处理和计算机视觉领域表现出色，但在零样本图像识别等特定下游任务中表现有限，亟需优化。本发明公开了一种基于数据集标签的前后缀自适应文本提示方法，提升模型在零样本识别中的表现。首先，通过在数据标签前后引入可学习的前后缀向量，动态地调整文本提示，有效利用了大模型的语义理解能力，进而提升了模型对新类别的适应性和泛化能力。其次，利用自注意力机制提取并融合数据集标签特征，从而生成更加有效的自适应文本提示。实验结果表明，该方法显著提升了模型的零样本识别能力，尤其是在复杂视觉任务中的应用，为大规模预训练模型的进一步发展和应用提供了有力支持。

技术关键词

提示方法预训练模型数据标签图像识别方法前馈神经网络文本编码器标签特征计算机视觉注意力机制自然语言样本动态地阶段关系语义参数

系统为您推荐了相关专利信息

一种基于对抗学习的issue标题生成模型鲁棒性提升方法

鲁棒模型鲁棒性样本生成方法训练集大语言模型

一种智慧矿山管理系统

智慧矿山管理系统矿井环境风速异常数据协方差矩阵

用于直播管控的低质音频预测系统

并行数据通信直播终端执行机构预测系统并行数据总线

一种多尺度注意力融合的显微高光谱图像分割方法

双线性插值方法多尺度特征融合分支双编码器模块

多模态医疗数据动态融合的智能决策系统及其方法

智能决策系统多模态深度学习算法电子病历智能决策方法

一种基于自适应文本提示的zero-shot图像识别方法

站点导航

APP 下载