一种基于生成式语言模型的多模态人脸检索方法

正文

推荐专利

申请号：CN202410798511

申请日期：2024-06-20

公开号：CN118656511A

公开日期：2024-09-17

类型：发明专利

摘要

本发明属于人脸识别领域，具体涉及一种基于生成式语言模型的多模态人脸检索方法，包括：建立生成式语言模型，对生成式语言模型进行训练，向训练完成后的生成式语言模型输入行人图片和对应的描述性文本进行人脸检索，得到检索结果。本发明构建了一个强大建模能力的生成式语言模型，可以获取语义更加丰富的文本表示，并通过引入特殊标记，使文本描述和图像内容可以更好的互补，增强了模型的理解能力，还实现了多任务的联合训练，包括文本生成、视觉问答、人脸检测和人脸检索，不同任务的学习可以相互促进,提高模型的泛化能力，弥补了基于生成式语言模型进行人脸检测和人脸检索任务的空白。

技术关键词

人脸检索方法特征提取器人脸图片文本特征向量图像特征向量样本解码矩阵乘法运算前馈神经网络图像处理标签图像编码注意力机制

系统为您推荐了相关专利信息

一种中医问答数字人制作方法

工作流可执行程序代码语音识别技术语音情感分析个性化语音

一种基于光清洗的液晶屏气泡缺陷检测及处理方法和装置

液晶屏表面紫外光源图像处理算法气泡特征提取器

基于边缘检测的OCR图像精细分割系统

边缘检测分割系统文本图像采集模块字符识别器

一种大数据文本检索挖掘系统及方法

文本挖掘系统图谱层次聚类算法检索策略

一种基于复杂环境的高保真音乐降噪方法及系统

噪声特征降噪方法降噪模型音乐特征提取模块

一种基于生成式语言模型的多模态人脸检索方法

站点导航

APP 下载