多模态实体识别方法、装置、终端设备及介质

AITNT
正文
推荐专利
多模态实体识别方法、装置、终端设备及介质
申请号:CN202510540193
申请日期:2025-04-27
公开号:CN120508973A
公开日期:2025-08-19
类型:发明专利
摘要
本申请公开了多模态实体识别方法、装置、终端设备及介质,包括:获取输入数据,其中,输入数据至少包括文本数据和图像数据;根据输入数据和预先训练好的识别模型,确定与输入数据对应的实体信息,其中,预先训练好的识别模型是对多模态样本数据进行文本特征和图像特征的提取,并对文本特征和图像特征进行融合,得到融合特征,采用融合特征对基于跨模态注意机制的训练模型进行训练得到的,本申请实施例通过增加一个多模态特征融合编码模块,该模块利用三种视觉特征来表示图像语义的各个方面。最后,通过协作表示整合这些特征,并使用共享的多任务标签解码器来联合解码文本和多模态表示,以进行实体预测,提高了多模态实体预测的准确性。
技术关键词
实体识别方法 融合特征 多模态 图像视觉特征向量 图像特征向量 数据 跨模态 BERT模型 样本 语义 文本特征向量 标签 多任务 编码向量 终端设备 机制
系统为您推荐了相关专利信息
1
一种基于特征融合和伪标签挖掘的半监督小尺度牙齿疾病自动化检测方法和装置
自动化检测方法 牙齿疾病 标签 学生 多尺度特征金字塔
2
一种集群框架下不平衡遥感图像在线识别方法
在线识别方法 遥感图像识别 分布式文件存储系统 遥感图像分类 集群
3
一种工作面实时轮廓的控制系统及控制方法
液压支架 基准轮廓 采煤设备 多模态数据采集 控制系统
4
基于多模态大语言模型的视频理解方法及装置
大语言模型 多模态 视频理解方法 关键帧 视频帧
5
多模态访客信息登记方法、装置、电子设备及存储介质
信息登记方法 身份验证 门岗设备 人脸图像数据 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号