一种面向多图像场景的多模态命名实体识别方法及系统

AITNT
正文
推荐专利
一种面向多图像场景的多模态命名实体识别方法及系统
申请号:CN202511059945
申请日期:2025-07-30
公开号:CN120930645A
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种面向多图像场景的多模态命名实体识别方法及系统,其中方法包括:S1.对输入的文本序列及关联的若干图像进行对象检测,获得每张图像中的候选对象集合;S2.提取文本序列的文本特征,并提取各候选对象的对象特征;S3.基于对象特征的相似度进行相关性聚类,从聚类结果中筛选与命名实体相关的跨图像一致性对象;S4.将文本特征与一致性对象特征输入动态融合网络,通过跨模态注意力机制动态调整模态权重,生成多模态融合表示;S5.对多模态融合表示解码获得命名实体识别结果。本发明解决了传统方法在多图像场景中存在的噪声干扰和模态权重静态分配问题。
技术关键词
命名实体识别方法 命名实体识别系统 图像 文本 注意力机制 多模态 对象检测 跨模态 场景 置信度阈值 聚类 动态 序列 条件随机场 识别模块 网络
系统为您推荐了相关专利信息
1
一种构建中文智能问答系统的方法及装置
中文文本分类 智能问答系统 语音识别模型 深度卷积神经网络 深度学习模型
2
一种生态环境案卷的智能评查系统和方法
审核规则 审核模型 合规性 台账信息 OCR识别技术
3
一种输电走廊植被风险隐患检测方法、系统、设备及存储介质
输电走廊 植被 融合特征 点云 纹理
4
一种用于电梯井道防坠落的危险行为预警系统
多模态数据采集 改进型卷积神经网络 预警系统 注意力机制 数据处理模块
5
一种印刷套印缺陷的检测方法和系统
模板 线性变换矩阵 模块 无监督聚类 图像处理技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号