一种基于自适应文本提示的zero-shot图像识别方法

AITNT
正文
推荐专利
一种基于自适应文本提示的zero-shot图像识别方法
申请号:CN202411458089
申请日期:2024-10-18
公开号:CN119625481A
公开日期:2025-03-14
类型:发明专利
摘要
尽管大规模预训练模型在自然语言处理和计算机视觉领域表现出色,但在零样本图像识别等特定下游任务中表现有限,亟需优化。本发明公开了一种基于数据集标签的前后缀自适应文本提示方法,提升模型在零样本识别中的表现。首先,通过在数据标签前后引入可学习的前后缀向量,动态地调整文本提示,有效利用了大模型的语义理解能力,进而提升了模型对新类别的适应性和泛化能力。其次,利用自注意力机制提取并融合数据集标签特征,从而生成更加有效的自适应文本提示。实验结果表明,该方法显著提升了模型的零样本识别能力,尤其是在复杂视觉任务中的应用,为大规模预训练模型的进一步发展和应用提供了有力支持。
技术关键词
提示方法 预训练模型 数据标签 图像识别方法 前馈神经网络 文本编码器 标签特征 计算机视觉 注意力机制 自然语言 样本 动态地 阶段 关系 语义 参数
系统为您推荐了相关专利信息
1
一种基于对抗学习的issue标题生成模型鲁棒性提升方法
鲁棒模型 鲁棒性 样本生成方法 训练集 大语言模型
2
一种智慧矿山管理系统
智慧矿山管理系统 矿井环境 风速 异常数据 协方差矩阵
3
用于直播管控的低质音频预测系统
并行数据通信 直播终端 执行机构 预测系统 并行数据总线
4
一种多尺度注意力融合的显微高光谱图像分割方法
双线性插值方法 多尺度特征融合 分支 双编码器 模块
5
多模态医疗数据动态融合的智能决策系统及其方法
智能决策系统 多模态 深度学习算法 电子病历 智能决策方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号