摘要
本发明公开了一种基于校准的PDF文档页码范围匹配方法及系统,该方法包括:获取待分析的PDF投标文档;将PDF投标文档转换为正文内容样式结构保留的可编辑投标文档,且对可编辑投标文档进行页码校准和目录校准,获得标准化投标文档;获取针对投标文档的目标评审项,基于至少一种检索方式在标准化投标文档中进行检索,获取与目标评审项关联的正文所在页码范围;将至少一种检索方式下在标准化投标文档的目录中和/或正文中得到的检索输出内容联合,得到目标评审项的有效评审页码范围。本发明实现为专家评审或者为AI模拟专家评审定位有效评审正文内容,使评审过程能聚焦于相关内容进行评审结论生成,提高评审效率。
技术关键词
大语言模型
目录
校准
样式结构
内容生成方法
关键词
编辑
语义
数据项
校验方法
板块
格式
标记