一种基于语义匹配的上下文模态补全多模态学习方法

正文

推荐专利

申请号：CN202510717076

申请日期：2025-05-29

公开号：CN120633782A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种基于语义匹配的上下文模态补全多模态学习方法，涉及多模态学习技术领域，包括以下步骤：对于存在模态损坏的多模态样本，基于保留的完好模态数据，从数据库中匹配语义相关的完整样本；根据所述语义相关完整样本的模态数据，结合剩余完好模态的语义信息，生成损坏模态的补全表示；将补全后的模态数据与剩余完好模态数据输入多模态融合模型，生成预测结果；通过任务相关损失和补全损失的组合优化模型参数，提升模态损坏条件下的性能稳定性。本发明，通过语义匹配和上下文模态补全的创新框架，有效解决了多模态学习中的模态损坏问题，显著提高了多模态融合模型在模态损坏情况下的性能和稳定性。

技术关键词

多模态学习方法样本语义关联网络数据模态特征参数文本音频场景误差框架图像

系统为您推荐了相关专利信息

一种用于AR眼镜的检测及远程控制系统

远程控制系统 AR眼镜能源管理模块身份识别模块远程通讯模块

网络路径主动选择方法、设备、介质及程序

建立数据传输通道可读存储介质算法网络节点处理器

一种基于摄像头与雷达的道路隐患定位方法及装置

道路图像数据激光点云数据 DBSCAN算法定位方法激光雷达

基于图像识别技术的集料比表面积计算方法

集料比表面积颗粒状片状图像识别技术计算方法

联合视觉AI与陀螺仪的机器人路径规划方法及装置

姿态估计视觉系统障碍物融合姿态修正机器人

一种基于语义匹配的上下文模态补全多模态学习方法

站点导航

APP 下载