摘要
本发明涉及工程图纸信息提取技术领域,特别涉及一种说明类图纸信息提取方法、装置、设备及介质,其中,方法包括:基于规则提取文本序号,并采用大模型验证序号结果和判断不存在序号时的语句划分位置,将一或多个相邻的单行文本组合成语义完整的说明语句;基于可信度规则对各条说明语句的序号进行分组,构建说明语句树状层级结构,并基于预设信息的关键词在结构上对各节点内容进行定位和拼接,得到信息相关语段内容;分别采用带可信度的规则和大模型对预设信息项进行提取,二者结果矛盾时根据可信度进行取舍或再次利用大模型判断,得到最终信息结果。由此,解决了现有技术难以确定结果的可信程度,无法判断和应对大模型回答错误的情况等问题。
技术关键词
语句
信息提取方法
大语言模型
可信度评估方法
关键词
节点
列表
层级
文本识别
信息提取技术
信息提取装置
数据
处理器
工程图纸
关系
计算机程序产品
拼接模块
索引