摘要
本发明涉及数据处理技术领域,尤其涉及一种高速公路数据元的归集方法、装置及电子设备。方法包括:从高速公路的业务系统中获取数据字典;根据数据字典的描述信息,构建多个数据分类字典;对每一数据分类字典进行分词处理,并从分词结果中去除语义无关词,得到分词文本;根据分词文本之间的相似程度,从分词文本中确定至少一个数据元,并将至少一个数据元归集至数据库中。本发明通过采用上述方法,解决在高速公路的业务场景下,数据表和数据字段达到几万数量级时,人工很难完成如此庞大的数据校验,导致录入或采集的数据质量低的问题。
技术关键词
归集方法
数据分类
字典
中文分词
文本
业务系统
非暂态计算机可读存储介质
关系
语义
同义词
归集装置
拼音
电子设备
数据采集单元
处理器
数据处理单元
数据处理技术
计算机程序产品