摘要
本发明涉及数据处理技术领域,公开了一种基于大数据模型的文献查重智能评估系统及方法,该方法包括:采集学术平台的文献文本,提取每一文献文本的文献特征,建立文献数据库,提取文献数据库中文献关键词,并训练随机森林模型,当训练的随机森林模型的匹配准确率达到匹配准确率阈值时,则输出文献领域模型,基于文献领域模型确定目标查重文献的查重领域,根据查重领域确定文献数据库中对应的查重文献领域,基于文献处理的结果构建查重图示,根据查重图示确定和目标查重文献对应的疑似文献,根据查重相似度确定目标查重文献的查重评估等级。本发明通过利用大数据模型,避免了人为确定查重领域的误差,确保了查重评估的准确性。
技术关键词
随机森林模型
智能评估方法
文本
智能评估系统
节点
关键词
格式
句法结构
数据处理技术
平台
训练集
自然语言
分析模块
网格
代表
词语
参数
误差