基于多模态模型CLIP的隐空间净化的图像分类方法及装置

正文

推荐专利

申请号：CN202411558624

申请日期：2024-11-04

公开号：CN119418123B

公开日期：2025-12-12

类型：发明专利

摘要

本发明提出一种基于多模态模型CLIP的隐空间净化的图像分类方法和装置，包括：将待分类图片输入图文多模态对比预训练模型的图像编码器，得到待分类图片在隐空间上的表示向量；使用图文多模态对比预训练模型的文本编码器，得到空类别文本所表示的空类别文本嵌入向量；计算表示向量和空类别文本嵌入向量的概率似然值；提取表示向量的向量长度与方向矢量，计算似然概率值对方向矢量的梯度，采用梯度上升方法对方向矢量进行更新同时保持向量长度不变，得到净化向量；通过选择与最终净化向量相似度最高的类别文本嵌入向量，将类别文本嵌入向量对应的图像类别作为类别文本嵌入向量的分类结果。

技术关键词

图像分类方法多模态预训练模型图像分类装置文本编码器图像编码器信息显示设备图像类别图文图片人工智能模型模块计算机程序产品噪声电子设备可读存储介质理论处理器

系统为您推荐了相关专利信息

一种低空飞行安全起飞引导装置

红外热成像仪引导装置多模态环境视觉相机数据处理单元

一种基于Agent智能体的国际传播数据流动态管理方法及系统

动态管理方法分布式爬虫策略一致性算法元学习算法

VEM-Token节拍捕捉和对齐模型建构的方法

终点声乐指针序列双向通信协议

多模态传感网络数据压缩与高效传输的一体化方法、系统及存储介质

一体化方法多模态数据压缩模态传感器编码向量加密

基于自适应采样的多模态模拟信号数字化方法及系统

数字化方法量化误差校正算法多模态迭代优化方法

基于多模态模型CLIP的隐空间净化的图像分类方法及装置

站点导航

APP 下载