多模态实体识别方法、装置、终端设备及介质

正文

推荐专利

申请号：CN202510540193

申请日期：2025-04-27

公开号：CN120508973A

公开日期：2025-08-19

类型：发明专利

摘要

本申请公开了多模态实体识别方法、装置、终端设备及介质，包括：获取输入数据，其中，输入数据至少包括文本数据和图像数据；根据输入数据和预先训练好的识别模型，确定与输入数据对应的实体信息，其中，预先训练好的识别模型是对多模态样本数据进行文本特征和图像特征的提取，并对文本特征和图像特征进行融合，得到融合特征，采用融合特征对基于跨模态注意机制的训练模型进行训练得到的，本申请实施例通过增加一个多模态特征融合编码模块，该模块利用三种视觉特征来表示图像语义的各个方面。最后，通过协作表示整合这些特征，并使用共享的多任务标签解码器来联合解码文本和多模态表示，以进行实体预测，提高了多模态实体预测的准确性。

技术关键词

实体识别方法融合特征多模态图像视觉特征向量图像特征向量数据跨模态 BERT模型样本语义文本特征向量标签多任务编码向量终端设备机制

系统为您推荐了相关专利信息

一种基于特征融合和伪标签挖掘的半监督小尺度牙齿疾病自动化检测方法和装置

自动化检测方法牙齿疾病标签学生多尺度特征金字塔

一种集群框架下不平衡遥感图像在线识别方法

在线识别方法遥感图像识别分布式文件存储系统遥感图像分类集群

一种工作面实时轮廓的控制系统及控制方法

液压支架基准轮廓采煤设备多模态数据采集控制系统

基于多模态大语言模型的视频理解方法及装置

大语言模型多模态视频理解方法关键帧视频帧

多模态访客信息登记方法、装置、电子设备及存储介质

信息登记方法身份验证门岗设备人脸图像数据多模态

多模态实体识别方法、装置、终端设备及介质

站点导航

APP 下载