摘要
本发明提供一种基于文本自动对齐的文本行人检索方法,通过计算全局特征来关注图像和文本整体之间关系的同时,还通过词注意力模块自动得到了描述人体每一部分图像的加权文本特征,通过局部特征交互模块自动实现了每一部分图像之间和文本描述中每个单词之间的相互关联,即在实现了文本内容与图像进行自动对齐后,再开始进行检索。该方法在应用中比较灵活,是一种符合实际应用场景的文本行人检索方法。
技术关键词
文本
图像全局特征
图像局部特征
行人检索方法
加权特征
三元组损失函数
BERT模型
全局平均池化
计算方法
注意力
人体
更新模型参数
网络
分块
模块
数据
强度