摘要
用于分类的方法、系统和设备。在一个方面,一种方法包括:接收输入和将该输入分类到多个类别中的一个中的请求,使用多模态模型处理该输入以生成(i)对该输入的描述和(ii)类别预测,使用文本编码器嵌入神经网络处理对该输入的描述和该类别预测以生成(i)文本描述特征嵌入和(ii)预测特征嵌入,至少从该描述特征嵌入和该预测特征嵌入生成表示该输入的查询特征嵌入,以及使用该查询嵌入将该输入分类到多个类别中的一个中。
技术关键词
文本编码器
预测特征
查询特征
多模态
生成图像特征
图像编码器
计算机
标签
存储装置
分类器
模板
指令