摘要
本申请提出了一种联邦公文检错模型、公文检错方法及系统。属于文本检错技术领域,该模型包括中文预训练的词向量模型BERT Embedding、Encoder结构、Decoder结构和转移矩阵CRF层。公文检错方法包括将转化后的向量通过Encoder结构对本地数据集进行初步训练和参数更新得到Encoder向量,并将得到Encoder向量传入共有结构/私有结构;通过共有结构/私有结构中的Decoder结构对输入的Encoder向量进行再训练得到训练好的Encoder向量;将训练好的Encoder向量通过转移矩阵CRF层对输出概率做调整,得到输出结果,并根据输出结果更新模型参数,多轮迭代,直至完成训练得到训练好的公文检错模型;对输入的公文进行纠错并显示纠错内容。通过这样的设置够提升公文检错的准确率。
技术关键词
检错方法
更新模型参数
模型训练模块
纠错
语句
网络通信方式
矩阵
检错系统
检错技术
字符
代表
数据
处理器
可读存储介质
电子设备
程序
跨度
冗余
文本
系统为您推荐了相关专利信息
验证环境平台
硬件验证方法
语句
钩子
接口参考模型
密钥
数据加密传输方法
序列密码算法
日期
分组密码算法
土壤湿度反演方法
信噪比数据
分量特征
多层感知机
气候