摘要
本发明涉及核电在役检查报告生成技术领域,旨在解决核电在役检查报告人工编制成本大、数据准确性和一致性无法保证、数据更新困难和利用率低的问题,本发明提供一种基于文档标注和标签化技术的核电在役检查报告生成方法,包括:将收集的在役检查领域相关数据解析出文本内容进行结构化存储;建立专业词汇识别模型,进行文本分词;对文本分词结果进行领域专有名词识别;根据预定义的规则和指南,通过NLTK词性标注器对词语进行调整并标上标签;将标注后的文本数据集转化为词向量,并计算位置向量;解析处理役检记录内容;生成在役检查报告,本发明节约成本的同时提高数据利用率,为核电在役检查人员提供更加智能化的报告生成服务。
技术关键词
检查报告生成方法
计算机可读指令
标签
分词
检验方法
文本分类模型
词语
可读存储介质
文件特征
专业名词
清洗规则
预训练模型
生成技术
分析工具
数据更新
计算机设备
系统为您推荐了相关专利信息
融合特征
识别方法
图像特征提取方法
可见光图像
深度残差网络模型
飞行器
协同测试方法
资源
计算机可读指令
计算机程序指令