基于多模态的生成式广义零样本学习方法

正文

推荐专利

基于多模态的生成式广义零样本学习方法

申请号：CN202510265734

申请日期：2025-03-07

公开号：CN120105202A

公开日期：2025-06-06

类型：发明专利

摘要

本发明公开了一种基于多模态的生成式广义零样本学习方法，包括如下步骤：S1、采集并预处理图像和文本数据；S2、采用自监督学习优化图像特征，生成视觉特征向量；S3、采用上下文注意力增强文本特征，生成文本特征向量；S4、构建跨模态嵌入空间，对齐视觉与文本特征，构造正负样本对；S5、计算样本对相似度，优化跨模态特征分布；S6、引入正则化约束，利用改进的高斯混合变分自编码器建模已知类别特征，并生成未知类别特征；S7、训练分类模型，在优化后的跨模态嵌入空间进行类别预测。本发明融合视觉与文本特征，优化跨模态对齐，提升未知类别特征质量，克服现有零样本学习方法在跨模态对齐和泛化能力上的不足。

技术关键词

零样本学习方法视觉特征文本特征向量跨模态生成特征协方差矩阵多模态训练分类模型高斯混合模型编码器广义监督学习策略交叉注意力机制图像局部特征语义特征

基于多模态的生成式广义零样本学习方法

站点导航

APP 下载