摘要
本发明公开了一种基于大模型与图文关联构建知识图谱节点的方法,涉及知识图谱领域。方法包括:解析数字文档以提取带边界框坐标的图像和文本对象;识别文本对象的版面角色,角色体系包含标题类角色和正文类角色;针对图像对象,执行一个分层的决策逻辑进行图文关联,该逻辑优先选择版面角色为标题类角色的文本作为描述来源,若失败则选择语义相似度最高的正文类角色文本;量化一个表征该关联可靠性的关联置信度分数;生成一个包含最优文本描述和关联置信度分数的知识图谱图像节点。本发明通过利用文档的版面结构信息进行分层决策,并为每一个关联结果赋予量化的置信度,提升了知识图谱构建的准确性、可信度与可解释性。
技术关键词
构建知识图谱
文本
对象
节点
图文
置信度阈值
图像
应用程序编程接口
知识图谱构建
版面结构
三元组
决策
实体
关系
逻辑
语义
坐标
分层
参数
系统为您推荐了相关专利信息
邮箱服务器
敏感词检测模型
情感倾向分析
书法作品
邮件正文
房屋框架结构
场景生成方法
自然语言
房间
词嵌入向量