摘要
本发明属于自然语言处理技术领域,具体涉及一种基于指针网络的乱序文本纠错方法;包括:获取纠错文本数据并构造标签;提取纠错文本数据的词级特征向量;根据纠错文本的词级特征向量提取局部特征向量;拼接词级特征向量与局部特征向量以构造融合特征向量;根据融合特征向量,采用查询机制构建span指针得分表和next指针得分表;根据span指针得分表缩小next指针得分表;根据span得分表和next指针得分表对乱序文本进行重排序,得到最终纠正后的文本;计算模型总损失并根据总损失调整模型参数,得到训练好的乱序文本纠错模型;使用训练好的模型进行文本纠错;本发明提高了自动校对系统准确率,且模型推理速度更快。
技术关键词
文本纠错方法
指针
纠错文本
查询机制
一维卷积神经网络
校对系统
标签
列表
掩码矩阵
自然语言
队列
数据
元素
参数
序列
系统为您推荐了相关专利信息
内容缓存方法
一维卷积神经网络
输入神经网络模型
互联网
缓存装置
板式无砟轨道结构
损伤识别方法
卷积神经网络模型
待测结构
砂浆