一种面向视觉和语言模型的统一提示学习方法

AITNT
正文
推荐专利
一种面向视觉和语言模型的统一提示学习方法
申请号:CN202511010846
申请日期:2025-07-22
公开号:CN120911411A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种面向视觉和语言模型的统一提示学习方法。本发明步骤:步骤1:定义统一的模态无关提示;步骤2:使用轻量级Transformer层转换统一提示;步骤3:将转换后的提示分别输入到文本编码器和视觉编码器;步骤4:在下游任务训练中仅优化统一提示和轻量级Transformer层;步骤5:通过联合优化实现更可靠的预测。本发明简化了视觉‑语言模型的适应性学习流程,提高了模型在少量样本学习和领域泛化任务上的性能。
技术关键词
学习方法 文本编码器 视觉 图像编码器 预训练模型 注意力 定义 网络 层级 参数 样本 模块
系统为您推荐了相关专利信息
1
一种全天候桥梁结构位移测量方法
Hessian矩阵 特征点 图像采集设备 基准特征 桥梁结构
2
一种基于可靠性样本选择的网络入侵检测方法及系统
网络入侵检测方法 样本 注意力模型 网络入侵检测系统 标签
3
一种小样本医学图像分类方法、系统、装置及存储介质
医学图像分类方法 原型 医学图像分割 序列 重叠切片
4
罐体码垛补料联动控制方法
联动控制方法 分布式传感器网络 罐体 模糊控制规则 视觉识别传感器
5
一种基于多模态大模型的应急态势理解系统、方法及存储介质
理解系统 多模态数据采集 多模态特征融合 强化学习算法 非临时性存储介质
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号