摘要
本申请公开了一种基于AC自动机的地址标准化方法、装置及设备,包括:在AC自动机的构建过程中,将地址标准库中的汉字形式的地址作为树节点,确定汉字的树节点间的级别关系,构建汉字树结构;将地址标准库中的拼音形式的地址作为树节点,确定拼音的树节点间的级别关系,构建拼音树结构;响应于地址标准化指令,获取输入到AC自动机的待标准化地址;利用AC自动机对待标准化地址,基于所述汉字树结构及拼音树结构,采用多模态的匹配算法进行地址匹配,根据匹配结果得到标准化地址。以此解决传统的深度学习算法受限于资源的限制、传统匹配算法都是根据字符串匹配进行搜索,然而使用这些算法不能很好的处理地址中存在音同字不同等问题。
技术关键词
AC自动机
汉字
拼音
地址标准化方法
多模态
节点更新
计算机存储介质
模糊匹配算法
关系
深度学习算法
指令
处理器通信
冗余
模块
存储器