一种基于跨模态引导交互融合的多模态命名实体识别方法

正文

推荐专利

申请号：CN202510419510

申请日期：2025-04-03

公开号：CN120337928A

公开日期：2025-07-18

类型：发明专利

摘要

本发明涉及一种基于跨模态引导交互融合的多模态命名实体识别方法，包括构建数据集，设计跨模态对比聚合机制，分别提取图像特征和文本特征并构建对比学习机制用以筛选出与文本语义高关联度的图像特征进行动态聚合，引入DINO模型提取图像特征，构建动态相似匹配方法，基于文本特征和图像特征相关性矩阵生成动态相似度匹配权重，利用动态门控机制自适应选择与文本特征上下文相关的图像特征，构建跨模态融合与引导交互策略，输出增强的语义表征向量，采用条件随机场解码器将多模态融合后的语义表征向量映射为最终的实体标签序列，完成实体识别；本发明具有显著提升多模态实体识别的鲁棒性与准确性的优点。

技术关键词

命名实体识别方法跨模态文本图像语义 BERT模型条件随机场动态门控视觉特征社交媒体平台多模态注意力键值交互机制掩码矩阵解码器

一种基于跨模态引导交互融合的多模态命名实体识别方法

站点导航

APP 下载