考虑多粒度语义对齐的多模态人体大模型训练方法及系统

正文

推荐专利

申请号：CN202411703678

申请日期：2024-11-26

公开号：CN119625351A

公开日期：2025-03-14

类型：发明专利

摘要

本发明涉及人工智能多模态大模型技术领域，公开了一种考虑多粒度语义对齐的多模态人体大模型训练方法及系统，所述方法包括：通过改进网络结构对大规模训练集进行前缀构造，基于人体特征对所述训练集中的数据附加描述相关的前缀；分批训练所述多模态人体大模型，将每一批训练数据中每张图像与每个文本进行配对，通过相似度计算和语义松弛进行对比损失的改进，优化视觉及文本模态编码器参数，通过以上方法,实现了一种考虑多粒度语义对齐的多模态人体大模型训练系统，针对当前多模态大模型在人体跨模态检索应用中遇到的多粒度语义对齐难题，分别从网络结构与损失函数两个方面对通用多模态大模型进行改进，增强在多粒度语义下跨模态人体检索的性能。

技术关键词

模型训练方法语义多模态人体特征编码器参数模型训练系统训练集松弛文本特征向量图像特征向量神经网络结构数据模板组合视觉跨模态

考虑多粒度语义对齐的多模态人体大模型训练方法及系统

站点导航

APP 下载