摘要
本申请公开了一种实体识别抽取方法、装置、设备及存储介质,涉及自然语言处理技术领域,包括:确定目标领域文本中的目标文字,并利用待训练实体识别抽取模型对目标领域文本进行编码以得到相应的分词结果;其中,目标文字为目标领域文本中的单个文字;基于分词结果确定目标文字对应的单词有序序列并利用待训练实体识别抽取模型对单词有序序列进行训练以确定文本语义特征;基于文本语义特征和文本结构特征确定目标文本特征,并基于目标文本特征对待训练实体识别抽取模型进行训练,同时基于预设最终损失函数进行收敛训练以得到目标实体识别抽取模型,以便基于目标实体识别抽取模型进行实体识别抽取操作。这样一来,可以提高实体抽取的准确率。
技术关键词
文本
实体
语义特征
矩阵
融合注意力机制
分词
预训练模型
多头注意力机制
神经网络模型
序列
句法依存关系
门控循环单元
模型训练模块
编码
爬虫技术
抽取装置
自然语言
可读存储介质
分类器
数据
系统为您推荐了相关专利信息
策略优化方法
生成动作
稳定度量值
策略优化装置
异构
敏感信息识别方法
面向多模态数据
CRF模型
文本
网络安全防护
角色扮演方法
语义向量
实体
自然语言
计算机终端设备
高光谱图像分类方法
高频特征
立方体
多头注意力机制
矩阵
关系建模
文本编码器
区域滤波器
解码器
视觉特征