摘要
本发明属于命名实体识别技术领域,具体涉及一种基于深度学习的实体标注与识别方法及装置,所述方法包括:获取训练文本并采用BIO标注法对训练文本进行标注;将标注好的训练文本进行处理;将处理后的文本输入预训练好的BERT‑CRF模型,完成模型在命名实体识别上的微调;将待识别的文本A输入微调后的BERT‑CRF模型得到各类别的实体集合;利用训练好的LDA模型对待识别的文本A进行主题分析,得到文本A的主题以及所述主题下概率大于设定值的关键词;对所述的各类别的实体集合进行核验,将集合中与主体和关键词不匹配的实体进行修正。能够对实体进行人工的修正,提升了命名实体识别的准确率。
技术关键词
CRF模型
文本
BERT模型
识别方法
列表
词语
关键词
矩阵
命名实体识别技术
主题模型
字典
识别装置
分析模块
标记
序列
密度
系统为您推荐了相关专利信息
深度学习模型
加速卡
控制终端
处理器运行方法
拆分规则
纠错文本
大语言模型
文本纠错方法
滑动窗口
行业术语
统计特征
二分类模型
文件检测方法
计算机执行指令
文本
状态识别方法
沥青路面层间结构
深度学习识别模型
融合卷积神经网络
地质雷达