一种基于大语言模型的科技文献表格知识链生成方法

正文

推荐专利

申请号：CN202511056789

申请日期：2025-07-30

公开号：CN120930615A

公开日期：2025-11-11

类型：发明专利

摘要

本申请提供了一种基于大语言模型的科技文献表格知识链生成方法，涉及语义处理技术领域，所述方法包括：接收源自科技文献的表格图像、PDF提取区域和结构化源码，结合表格上下文信息生成初始输入信息；调用多模态大语言模型进行表格内容识别和结构化处理；基于初始HTML结构表示与原始表格图像及表格上下文信息执行迭代自校正；基于预设科学实体本体，对高保真HTML结构表示进行语义信息抽取；根据预设逻辑范式和实体抽取结果，组织成知识链。通过本申请可以解决现有技术中由于在处理复杂和非规范化表格时易出现识别错误，且深度逻辑关系挖掘能力不足，导致内容识别精度不足的技术问题，提高了表格内容识别和结构解析的精度。

技术关键词

大语言模型表格生成方法实体校正科技物理布局信息深度语义分析逻辑合并单元格生成知识语义层面文本段落多模态图像组织精度

系统为您推荐了相关专利信息

文本数据处理方法、装置、计算机设备、可读存储介质和程序产品

文本数据处理方法大语言模型字符风格文本数据处理装置

一种基于智能体任务规划的光伏项目报告生成方法、系统、设备及存储介质

报告生成方法规划非易失性存储介质多层次项目

一种基于人工智能的视频检测方法、装置、设备、存储介质及程序产品

实体物理视频检测方法视频检测装置音频

基于RAG技术与大语言模型的情感预测方法

情感预测方法文本索引大语言模型语义向量

用于发光负载的线性恒流调光模块和调光系统

恒流调光线性恒流电路电压反馈电路调光系统信号处理模块

一种基于大语言模型的科技文献表格知识链生成方法

站点导航

APP 下载