摘要
本申请提供一种标书处理方法及系统。所述标书处理方法包括:获取多个标书文件;执行标书纠错方法对所述标书文件进行纠错获取纠错后的标书文件,和/或执行标书查重方法对所述标书文件进行查重获取标书查重结果;执行标书查重方法对所述标书文件进行查重获取所述标书查重结果的过程包括:剔除所述标书文件中与招标文件相似的文本内容,获取处理后的标书文件;将多个所述处理后的标书文件进行两两组合,获取多个标书文件组合;利用标书查重模型对每个标书文件组合进行文本内容比对,获取相似度查重结果;根据所述相似度查重结果,对多个所述处理后的第二标书文件中的相似标书语句进行两两语句含义对比,获取所述标书查重结果。
技术关键词
查重方法
文本
纠错方法
语句
纠错模块
分割算法
聚类算法
语义
主题
字符
数据