摘要
本发明属于文本纠错技术领域,提供一种基于联邦学习的文本纠错方法和系统。该方法包括:构建与各参与方相对应的语料库,形成相对应的训练集;对预训练模型进行微调,以获取微调后的初始模型参数,得到初始文本纠错模型;对微调后的初始模型参数进行加密得到加密后的初始模型参数;计算各参与方的语料库或场景任务的相似性,筛选待聚合处理的模型参数,进行安全聚合,得到相应的聚合模型参数;对聚合模型参数进行解密,进一步更新初始文本纠错模型;进行多轮联邦学习,得到最优文本纠错模型,以对待纠错文本进行纠错。本发明采用联邦学习方法让不同参与方在不共享原始数据的情况下,充分利用各方的专业语料,得到更精确的文本纠错模型。
技术关键词
文本纠错方法
参数
文本纠错系统
纠错文本
同态加密算法
解密
场景
文本纠错技术
表达式
生成算法
矩阵
联邦学习方法
训练集
节点
数据处理模块
注意力
系统为您推荐了相关专利信息
磁悬浮轴承
参数
样本
磁悬浮系统
拉丁超立方采样
三维点云数据
电缆隧道
三维空间模型
图像
坐标系
ElGamal算法
同态加密算法
字符
计算方法
场景