基于持续知识蒸馏的语法错误纠正方法、系统

正文

推荐专利

申请号：CN202411882587

申请日期：2024-12-19

公开号：CN119808764B

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及基于持续知识蒸馏的语法错误纠正方法、系统，属自然语言处理领域。本发明将蒸馏知识集作为教师模型与学生模型的输入，以输出的信息熵为基础进行量化打分，将蒸馏知识集划分为正集和负集；构建基于分布的蒸馏策略，使学生模型在正集上向教师模型学习，负集上学生模型避免犯教师模型同样的错误，实现知识蒸馏；构建知识继承策略，实现学生模型持续学习；通过知识蒸馏、学生模型持续学习和学生模型训练损失，产生训练总损失；根据训练总损失计算损失函数梯度，根据梯度及学习率更新模型参数权重，得到最终的语法错误纠正模型。本发明解决模型训练性能不高，平行语料库缺少问题，实现高效的知识转移，提升语法纠错模型效果。

技术关键词

学生纠正方法教师蒸馏信息熵更新模型参数平行语料库标签余弦定理训练集策略纠错数据自然语言编码计算方法优化器超参数定义

基于持续知识蒸馏的语法错误纠正方法、系统

站点导航

APP 下载