摘要
本发明公开了一种基于服装描述生成的行人性别与年龄识别方法及装置,涉及图像识别领域,包括:构建行人性别与年龄识别模型,通过线性映射层和前a层Transformer块将行人图像处理为识别特征和图像特征,利用人体部位检测模型获取行人图像中的人体部位的位置,并裁剪出各个人体部位图像,利用图像字幕生成模型生成各个人体部位图像对应的服装文字描述,并利用词嵌入模型将服装文字描述映射为服装文字描述向量,将服装文字描述向量输入特征提取模块,提取得到对应的向量特征,将所有向量特征拼接后再连接至识别特征和图像特征后,并依次经过后b层Transformer块、第一全连接层和Softmax函数层,得到识别结果,解决性别与年龄识别技术受观察角度与环境等因素影响较大的问题。
技术关键词
年龄识别模型
年龄识别方法
服装
识别特征
特征提取模块
后验概率
人体
词嵌入模型
输出特征
字幕
线性
图像处理
年龄识别技术
特征数
通道
处理器
计算机程序产品
识别装置
系统为您推荐了相关专利信息
改进型卷积神经网络
剩余寿命预测系统
序列
滑动窗口法
批量
视觉检测方法
灰阶
高分辨率相机
图像处理算法
深度学习算法
真实感
图像像素
图像编码器
图像抠图技术
人体结构
语义分割网络
图像识别方法
特征提取模块
计算机视觉图像分割
双线性插值
图像生成模型
生成方法
感知损失函数
特征提取模型
图像处理