摘要
本发明公开了一种面向社交媒体领域的多模态命名实体识别系统及方法,其中系统包括:采集模块、提取模块、计算模块、构建模块和识别模块;采集模块用于采集多模态命名实体识别数据集并将数据集并按照预设划分为训练集、验证集和测试集,数据集包括文本数据和图像数据;提取模块用于对数据集进行特征提取;计算模块用于基于提取的特征,计算文本数据和图像数据的语义相似度以及文本数据和图像数据按语义相似度关联的位置索引;构建模块用于基于语义相似度和位置索引,构建多模态命名实体识别模型;识别模块用于利用多模态命名实体识别模型完成命名实体类型的预测。
技术关键词
命名实体识别系统
命名实体识别模型
文本
数据
多模态
社交
语义
媒体
预处理装置
索引
图像特征提取
识别模块
图像像素
命名实体识别方法
归一化方法
训练集