摘要
本发明公开了一种无区间表征向量的实体共指消解方法,涉及自然语言处理技术领域,包括以下步骤:预先通过Bert微调模型编码区间内部和外部的信息,生成每个单词包含上下文信息的词嵌入表征向量,并将每一个单词的词嵌入表征向量作为输入;通过区间的开始token和结束token,来计算该区间是否是一个实体的得分。本发明消除了对区间表征向量、手工构造特征和语法解析的依赖,使可以在一个批次中处理多个文档而无需截断或滑动窗口,同时无需使用先验知识和修剪算法。该模型与基准线模型相比具有竞争力,占用内存更少,同时更简单、更高效。
技术关键词
实体共指消解方法
对象
滑动窗口
自然语言
双线性
参数
编码
标记
字母
内存
手工
矩阵
代表
算法
序列
系统为您推荐了相关专利信息
设备异常检测方法
时间滑动窗口
短时傅里叶变换
门控循环单元
声纹特征
行人检测方法
注意力机制
行人检测装置
车辆转向
加权特征
对象
建模方法
铁路信号控制系统
故障预测模型
对齐技术
组织特征数据
生成规则
图像生成系统
图像生成方法
颌骨区域