摘要
本发明公开了一种基于文本挖掘的高速公路交通事故致因网络搭建方法,包括步骤如下:收集高速公路交通事故调查报告,进行数据选择、转换与数据清洗,构建事故文本语料库;靶向中文分词,加载归并词表、自定义专业词典及停用词表,完成语料库数据化;兼顾文本特征词的权重和词频,进一步进行降维筛选,提取事故致因特征关键词。本发明充分利用高速公路交通事故非结构化文本数据,建构了显著事故致因数据中高度交互的词汇模式,相比于应用结构化数据更能还原事故发生时的情况,依据点互信息值搭建的事故成因网络能够有效解决词项间高频共现但语义关系薄弱的问题,清晰展示成因间的意义逻辑和关联,提升了高速公路交通事故致因网络的质量与可解释性。
技术关键词
高速公路交通事故
网络搭建方法
关键词
建立索引关系
节点
停用词表
中文分词
词频统计
非结构化文本
数据
词典
交通管理系统
特征词项
道路交通事故
可视化软件
挖掘算法
短距离
系统为您推荐了相关专利信息
管理控制系统
支持高分辨率
人工智能辅助
远程控制系统
节点
深度强化学习模型
压缩特征
特征提取网络
锁组
矩阵