摘要
本发明涉及电子档案管理领域,具体为一种基于大数据的电子档案管理方法及系统;本发明通过获取档案管理系统中的所有电子档案,之后对电子档案进行分词提取和向量化,以获得初始词集,并且通过计算初始词集中的各分词的第一相似度和构建有向图,以通过计算重要度挑选出最能够反映电子档案核心内容的重要词集,随后根据知识图谱构建背景分词集合,与重要文本词集进行对比,实现对重要词集中各分词的含义进行明确,以消除歧义,从而获得拓展词集,并最终通过计算各电子档案源数据的分类准确率,从而判断各电子档案源数据是否错误;解决了现有技术中难以确保工作人员在对电子档案进行分类时的准确率的问题。
技术关键词
分词
档案管理方法
分类正确率
电子
实体
大数据
文本
顶点
档案管理系统
表达式
知识图谱构建
分类准确率
存储计算机程序
曲线
存储器
系统为您推荐了相关专利信息
宽度特征
俯视特征
视角
环境感知数据
车辆控制方法
微功率无线通信网络
低压电力线载波
Word2Vec模型
误码率
语义