跨模态数据对齐模型训练方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510866651

申请日期：2025-06-24

公开号：CN120849905A

公开日期：2025-10-28

类型：发明专利

摘要

本申请实施例提供了一种跨模态数据对齐模型训练方法、装置、设备及存储介质，属于深度学习技术领域。方法包括：将获取到的多个初始样本输入初始模型中，对初始样本进行特征提取处理得到对应的初始特征；分别对各个初始特征进行特征变换处理得到高级模态语义，并将高级模态语义映射到公共空间中得到各个模态对应的独立公共语义；对于每一模态，基于融合引导模块对高级模态语义进行注意力计算得到融合公共语义；通过计算得到的公共语义损失值和重构损失值，对初始数据对齐模型的模型参数进行调整得到训练后的目标模型。本申请能够降低模型训练过程中不同模态间的语义割裂程度，增强最终在公共空间得到的多个公共语义表示之间的关联性。

技术关键词

语义模型训练方法注意力特征提取网络跨模态数据文本图像类别标签样本类别标签矩阵投影特征重构图像投影键值模块模型训练装置深度学习技术超参数

系统为您推荐了相关专利信息

一种基于多模态的设备缺陷检测方法及设备

可见光图像设备缺陷检测多模态融合特征性能预测模型

一种基于DETR的混凝土浇筑振捣表观质量评价方法及系统

混凝土评价方法图像环形补光灯检测模型训练

水下激光回波信号处理模型训练方法及水体深度测量方法

激光回波信号处理模型训练方法深度测量方法待测水体长短期记忆网络

一种舰船分类方法、装置、设备及系统

检测分类模型分类方法机载雷达特征提取网络人机交互界面显示

虚拟三维头部化身生成方法、装置、设备及存储介质

人脸图片生成方法多层感知器注意力超分辨率

跨模态数据对齐模型训练方法、装置、设备及存储介质

站点导航

APP 下载