摘要
本发明公开了图像识别技术领域的一种多模态融合的动态零样本图像识别方法及系统,包括将第一数据输入生成器,采用第一融合算法驱动所述生成器生成未见类别视觉特征,其中,所述第一数据包括高斯噪声、语义描述符、文本描述,未见类别视觉特征为生成样本。本发明通过将特征生成与嵌入模型、以及类别层级与实例层级的监督信息进行融合,借助对生成器与嵌入模型进行交替优化,在保证生成的图像质量的前提下,提高嵌入空间的区分能力,同时通过结合多源信息、协同特征生成与嵌入模型、引入动态调节机制的方式,能够有效缓解现有技术中的零样本学习中已见类别和未见类别的训练数据不平衡、类别偏差以及嵌入空间判别能力不足的问题。
技术关键词
视觉特征
样本
描述符
分类器
融合算法
语义
动态
非线性
多模态
噪声
文本
图像识别技术
参数
模块
嵌入特征
注意力机制
数据分布
系统为您推荐了相关专利信息
文本生成图像
真实感
真实面部
人口统计数据
分类器
TSK模糊系统
情感标注系统
多视角特征
标注方法
智慧资源管理系统
电力交易市场
模型优化方法
新能源场站
电力交易数据
定价策略
步态识别方法
半监督深度
聚类算法
无标签数据
信号处理方法
运动预测方法
呼吸运动预测模型
运动轨迹数据
多尺度特征融合
样本