基于对比学习的多级跨模态对齐方法

正文

推荐专利

基于对比学习的多级跨模态对齐方法

申请号：CN202510476484

申请日期：2025-04-16

公开号：CN120372545A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于对比学习的多级跨模态对齐方法，用于提高多模态情感分析的准确性和效率。该方法通过利用RoBERTa模型和Vision Transformer模型分别对文本和图像进行编码，获取文本和图像表示。全局跨模态对齐模块采用对比学习技术对文本和图像的表示进行对齐，以增强两者之间的一致性。此外，通过局部跨模态对齐模块，使用交叉注意力机制对文本和图像表示进行细粒度对齐，以识别关联图像和文本中较小、更具体的语义单元。该方法采用多任务学习框架整合来自文本和图像的跨模态信息，并通过条件随机场进行序列标签预测，识别和分类方面术语和情感。实验结果表明，该方法在Twitter‑2015和Twitter‑2017数据集上的性能优于现有的单模态和多模态模型，有效地提高了多模态情感分析的性能。

技术关键词

跨模态对齐方法交叉注意力机制条件随机场文本编码器对齐模块图像编码器术语大规模文本数据多模态情感分析多层感知机多任务标签样本序列

系统为您推荐了相关专利信息

一种多模态内容生成方法、系统及存储介质

内容生成方法关键词跨模态多模态主题

基于多模态大模型的智能家居控制方法及系统

智能家居控制方法多模态智能家居控制系统设备资源管理实时数据

一种基于跨模态学习的有源干扰识别方法

干扰识别方法跨模态学习语义数据样本

基于多模态大模型的测点时序异常分析方法及系统

异常分析方法注意力机制监督学习算法知识图谱数据库跨模态

一种模数转换芯片的数据对齐方法及装置

多路并行数据模数转换芯片数据对齐方法时钟模块

基于对比学习的多级跨模态对齐方法

站点导航

APP 下载