一种多模态融合的动态零样本图像识别方法及系统

正文

推荐专利

申请号：CN202511054998

申请日期：2025-07-30

公开号：CN120561871A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了图像识别技术领域的一种多模态融合的动态零样本图像识别方法及系统，包括将第一数据输入生成器，采用第一融合算法驱动所述生成器生成未见类别视觉特征，其中，所述第一数据包括高斯噪声、语义描述符、文本描述，未见类别视觉特征为生成样本。本发明通过将特征生成与嵌入模型、以及类别层级与实例层级的监督信息进行融合，借助对生成器与嵌入模型进行交替优化，在保证生成的图像质量的前提下，提高嵌入空间的区分能力，同时通过结合多源信息、协同特征生成与嵌入模型、引入动态调节机制的方式，能够有效缓解现有技术中的零样本学习中已见类别和未见类别的训练数据不平衡、类别偏差以及嵌入空间判别能力不足的问题。

技术关键词

视觉特征样本描述符分类器融合算法语义动态非线性多模态噪声文本图像识别技术参数模块嵌入特征注意力机制数据分布

系统为您推荐了相关专利信息

文本到图像扩散模型中用于公平性的方法和系统

文本生成图像真实感真实面部人口统计数据分类器

基于多视角栈式深度TSK模糊系统的织物情感标注方法

TSK模糊系统情感标注系统多视角特征标注方法智慧资源管理系统

新能源场站电力交易市场的定价模型优化方法

电力交易市场模型优化方法新能源场站电力交易数据定价策略

一种基于Lora的公共安全区域步态识别方法

步态识别方法半监督深度聚类算法无标签数据信号处理方法

一种多尺度特征融合呼吸运动预测方法及系统

运动预测方法呼吸运动预测模型运动轨迹数据多尺度特征融合样本

一种多模态融合的动态零样本图像识别方法及系统

站点导航

APP 下载