跨模态数据对齐模型训练方法、装置、设备及存储介质

AITNT
正文
推荐专利
跨模态数据对齐模型训练方法、装置、设备及存储介质
申请号:CN202510866651
申请日期:2025-06-24
公开号:CN120849905A
公开日期:2025-10-28
类型:发明专利
摘要
本申请实施例提供了一种跨模态数据对齐模型训练方法、装置、设备及存储介质,属于深度学习技术领域。方法包括:将获取到的多个初始样本输入初始模型中,对初始样本进行特征提取处理得到对应的初始特征;分别对各个初始特征进行特征变换处理得到高级模态语义,并将高级模态语义映射到公共空间中得到各个模态对应的独立公共语义;对于每一模态,基于融合引导模块对高级模态语义进行注意力计算得到融合公共语义;通过计算得到的公共语义损失值和重构损失值,对初始数据对齐模型的模型参数进行调整得到训练后的目标模型。本申请能够降低模型训练过程中不同模态间的语义割裂程度,增强最终在公共空间得到的多个公共语义表示之间的关联性。
技术关键词
语义 模型训练方法 注意力 特征提取网络 跨模态数据 文本 图像类别标签 样本类别标签 矩阵 投影特征 重构 图像投影 键值 模块 模型训练装置 深度学习技术 超参数
系统为您推荐了相关专利信息
1
一种基于多模态的设备缺陷检测方法及设备
可见光图像 设备缺陷检测 多模态 融合特征 性能预测模型
2
一种基于DETR的混凝土浇筑振捣表观质量评价方法及系统
混凝土 评价方法 图像 环形补光灯 检测模型训练
3
水下激光回波信号处理模型训练方法及水体深度测量方法
激光回波信号处理 模型训练方法 深度测量方法 待测水体 长短期记忆网络
4
一种舰船分类方法、装置、设备及系统
检测分类模型 分类方法 机载雷达 特征提取网络 人机交互界面显示
5
虚拟三维头部化身生成方法、装置、设备及存储介质
人脸图片 生成方法 多层感知器 注意力 超分辨率
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号