摘要
本发明公开了一种可行性研究报告智能解析与信息抽取方法、系统及设备,涉及自然语言处理及机器学习技术领域。所述方法是在读取可行性研究报告文档以得到报告文本后,先通过正则表达式或基于自然语言处理技术的句法分析方式,识别得到报告文本中的各个章节标题,并根据标题层级结构分别确定各个章节标题的标题类别,然后再针对标题类别属于报告审查重点对象的任一章节标题,从报告文本中提取得到对应的章节内容,并结合Word2Vec模型、命名实体识别和语义匹配技术,从章节内容中抽取得到关键业务信息,最后汇总并输出展示各个章节标题以及相应的所属标题类别/和关键业务信息,如此具有信息抽取高效性、高准确性、通用性、高度智能化和可扩展性等优点。
技术关键词
信息抽取方法
Word2Vec模型
报告
命名实体识别技术
分词
文本
聚类
语义
自然语言
机器学习算法
层级
信息抽取系统
主题
队列
展示单元
机器学习技术
可读存储介质
存储计算机程序
系统为您推荐了相关专利信息
指标
项目管理软件
自动化切换方法
偏差
资源约束条件
词典
知识图谱数据
分词方法
动态更新
元数据类型
自动化验证方法
自动化验证系统
操作系统
决策树模型
系统配置信息