摘要
本发明公开了一种基于数据增强的多模态实体连接方法,涉及数据处理技术领域,包括:利用大语言模型对实体增强,通过设计指令对实体描述进行摘要处理,提取关键信息并优化;利用多模态大语言模型对语义信息增强,通过融合文本和视觉特征生成增强的信息描述,包括实体的名称、类型、功能及行为特征、物理或结构属性,以及从视觉信息中提取的空间结构、外观形态、颜色纹理等视觉特征;通过检索技术来扩展和优化候选实体集合,实现检索增强;使用大语言模型进行决策性选择,从检索增强得到的候选实体集合中选择最佳匹配项。本发明通过多层次的数据增强和精确的实体选择过程,显著提高了多模态实体链接的准确性和效率。
技术关键词
大语言模型
摘要
文本
语义
实体消歧
模板
空间结构
检索技术
字符串匹配算法
属性匹配
视觉特征信息
指令
更新模型参数
多模态信息
度计算方法
置信度阈值
系统为您推荐了相关专利信息
识别方法
煤岩图像
深度学习模型训练
煤矿环境
非暂态计算机可读存储介质
业务执行方法
上下文感知技术
量子傅里叶变换
量子态
机制
动态知识图谱
知识点
多维特征向量
预警方法
策略