摘要
本发明公开了基于深度学习的智能图像识别系统及方法,包括:通过预训练的图像和文本特征提取网络分别从图像和文本中提取高级语义特征;使用扩展网络将图像和文本特征从低维空间映射到更高维度;引入局部和全局对比学习策略,通过动态重采样和记忆增强机制优化图像和文本特征的相似性;通过生成对抗网络或变分自编码器从图像特征生成辅助文本信息,并与真实文本标签进行对比学习;在高维统一嵌入空间中,通过精细的回归优化和语义匹配评分机制,使得图像和文本在推理阶段能够高效匹配并完成图像识别任务。本发明可以使图像和文本的语义相似度得以通过相同的距离度量进行比较,从而在推理阶段实现高效的图像与文本匹配。
技术关键词
文本
智能图像识别方法
智能图像识别系统
特征提取网络
生成对抗网络
区域卷积神经网络
评分机制
样本
语义特征
多模态
记忆
网络存储
交叉注意力机制
动态
损失函数优化
BERT模型
系统为您推荐了相关专利信息
融合知识图谱
生成方法
机械加工工艺
GBDT算法
梯度提升决策树
语音输入信息
样本
大语言模型
文本特征向量
数据