摘要
本发明公开了一种针对少量多模态病理标注数据混合提示学习框架的训练方法及系统。该训练方法包括获取原始CLIP模型、初始文本提示、与初始文本提示对应的训练图像,原始CLIP模型包括图像编码器和文本编码器;在图像编码器中插入可学习视觉提示标记,在文本编码器中插入可学习文本提示标记;将训练图像输入图像编码器与可学习视觉提示标记结合进行特征编码,得到视觉提示嵌入;将初始文本提示输入文本编码器与可学习文本提示标记结合进行特征编码,得到文本提示嵌入;基于视觉提示嵌入和文本提示嵌入的相似性,调整可学习视觉提示标记、可学习文本提示标记以及耦合函数的参数,得到混合提示学习框架,提升了模型的多模态结合能力。
技术关键词
标记
文本编码器
图像编码器
视觉
细粒度特征
融合特征
MLP神经网络
图像块
图像类别
序列
参数更新模块
框架
阶段
数据获取模块
训练系统
注意力
系统为您推荐了相关专利信息
关节点
网关
路由器
地址解析协议报文
虚拟私有云服务
深度学习神经网络模型
号码管
缺陷智能
深度学习算法
检测设备
拥堵分析方法
交通流量统计
视频分析
车道
数据处理模块