一种PDF图纸关键参数信息提取方法及系统

正文

推荐专利

申请号：CN202411741158

申请日期：2024-11-29

公开号：CN119672750A

公开日期：2025-03-21

类型：发明专利

摘要

本发明提出了一种PDF图纸关键信息提取方法及系统，属于信息技术领域。方法包括：获取当前任务的执行进程以及当前施工进程的详细文字描述，利用TextRank算法提取关键词；利用关键词在图纸库的元数据标签中进行搜索，快速筛选出与当前施工进程高度相关的图纸文件；对筛选出PDF图纸文件，采用OCR技术将PDF中的图像文字转换为可编辑的文本信息，并对文本信息进行预处理；根据预定义的参数提取规则从预处理后的文本中提取出关键参数，并进行合理度分析。通过自动化的信息提取流程，快速从大量的PDF图纸中精准提取出与当前项目执行进程相匹配的关键参数，大大提高了信息处理效率。对关键参数信息进行严格的合理度分析，进一步确保了提取信息的准确性和可靠性。

技术关键词

TextRank算法图纸数据标签关键词文本进程节点参数关键信息提取方法训练图像分类模型信息提取系统项目深度学习框架编辑词语分词

系统为您推荐了相关专利信息

一种数智化精神复元服务平台及其运行方法

生物反馈技术智能分析模块 Pearson相关系数线性回归模型机器学习技术

一种基于多模态相关性图对齐和多级交叉融合模型的指称多目标跟踪方法

跟踪方法多模态模态特征交叉注意力机制视频帧特征

基于SISA架构实现大语言模型的异常输出管理方法及系统

输出管理方法输出管理系统大语言模型风险文本

一种智能中俄双语电气自动化交互系统

交互系统模块文本语音电气自动化系统

基于大语言模型的论文创新质量的测度指标生成方法

指标生成方法论文大语言模型关键词指标生成系统

一种PDF图纸关键参数信息提取方法及系统

站点导航

APP 下载