摘要
本发明涉及电力地址文本的分词技术领域,尤其涉及一种用于居民用电地址文本的分词解析方法及装置,具体如下包括:(1)基于某地区居民用电地址语料,统计计算语料中各义素之间的连接特征信息;(2)对地址义素间连接特征信息进行组合与向量化表示;(3)采用预训练语言模型,将向量化地址义素间连接特征信息融合到语言模型中,进行模型的训练与微调,形成符合某地区居民用电地址语料特征的用电地址分词模型;(4)基于训练和微调完成的地址分词模型,对某地区居民用电地址进行分词解析。本发明解决现有技术中训练成本高、需要对硬件要求大且需大量标注数据的问题。
技术关键词
居民用电
解析方法
特征信息融合
预训练语言模型
分词模型
信息熵
字符
文本
地名词典
分词技术
元素
解析装置
数据
定义
存储器
处理器
矩阵
系统为您推荐了相关专利信息
关系抽取方法
样本
预训练语言模型
关系抽取模型
标签
海面风速反演方法
反演模型
卫星导航数据
多模态信息融合
轨迹
汽车后背门
唇语识别
开启方法
面部特征
运动特征
局部敏感哈希算法
网络拓扑
多层次
机器学习模型
深度学习模型