摘要
本发明提供一种核电阀门设计文件信息识别采集方法及系统,采集方法包括接收核电阀门设计文件,并基于CNN的阀门设计文件图像识别模型对核电阀门文件进行格式和几何要求预处理,得到目标阀门设计文件;基于CRNN的阀门图纸信息识别模型对目标阀门设计文件的待识别区域的信息进行识别;利用步骤3的识别结果创建语料分析库,并对语料分析库开展词性标注、中文分词处理;对步骤4的核电阀门已处理的语料结果开展文本分析,提取高频参数、关键参数,作为后续提取文本关键词的处理基础,并进行文本向量化处理;按照文本向量化相似度过滤无效信息,对已完成信息整合的关键信息进行正确性判断,然后将正确信息操作入阀门图纸信息数据库。
技术关键词
核电阀门
图像识别模型
图纸
关键词提取方法
关键词提取算法
中文分词
格式
门控循环单元
二值化阈值
文本段落
文字特征
计算机程序产品
序列特征
处理器
卷积特征
系统为您推荐了相关专利信息
背钻孔精度
线路板
成像
图像数据处理模块
图像数据采集模块
游戏
训练图像识别模型
动态障碍物
模式
静态障碍物
碱式碳酸镍
杂质分析方法
图像识别模型
序列
线段