摘要
本发明公开了一种基于自然语言文本的民航类招标文件处理方法,包括:选择完整的民航行业招标文件;将民航行业招标文件备份成两份,一份为文件A一份为文件B;文件A在上传完成后,以章节为切片点划分文件A,将文件A划分为商务部分A1和技术部分A2,对上述两部分的高频关键词组进行搜索;搜索完成后,代码再度进行检索;文件A部分招标文件中存在图片形式的内容,文件A对图片格式全局搜索;将文件A的全过程文件保存在原有文件路径下后对文件B进行处理;将文件B传输至机器学习代码中,由机器学习代码对文件B按商务、技术部分分解学习。本专利能够对民航类招标文件中的关键信息点进行发掘和分类,同时将图片等非文字形式文件单独整理并保存,提高前期工作分类整理效率。
技术关键词
自然语言文本处理
民航行业
分类模型方法
深度学习训练
切片
符号
图片
备份
关键词
训练集
服务器
接口
数据