摘要
本发明涉及人工智能技术领域,可应用于医疗健康领域,公开了一种分类方法、装置、计算机设备及存储介质,分类方法通过对每个图像识别任务创建提示嵌入组,利用多模态视觉语言模型对提示嵌入组进行更新,以及将多模态视觉语言模型输出的结果输入至MLP分类器,以对MLP分类器参数进行更新;并且预先构建任务原型记忆库,将任务原型和动态拼接阈值进行存储,使得多模态视觉语言模型不易遗忘早期学习的特征,便于MLP分类器根据任务原型和动态拼接阈值判断是否拼接提示嵌入组,从而得到更准确的分类结果。
技术关键词
多模态
分类方法
原型
文本编码器
视觉特征
动态
原始图像数据
特征值
计算机设备
记忆
分类器参数
可读存储介质
人工智能技术
医疗健康
处理器
系统为您推荐了相关专利信息
路面附着系数
车辆状态数据
多传感器融合
实时图像信息
深度图数据
运动捕捉数据
表面肌电信号
角度偏差值
运动轨迹数据
多模态数据采集
语义协同
交互式图像分割
跨模态
双向注意力
协同注意力