语言模型训练方法、文本处理方法、装置、设备及介质

正文

推荐专利

申请号：CN202510617411

申请日期：2025-05-14

公开号：CN120146200B

公开日期：2025-09-19

类型：发明专利

摘要

本发明提供一种语言模型训练方法、文本处理方法、装置、设备及介质，涉及自然语言处理技术领域，其中方法包括：基于教师模型，预测样本文本中各数据单元对应的第一概率矩阵；第一概率矩阵包括各数据单元属于第一词表中各词元的概率值；根据第一概率矩阵中各概率值的数值大小，对第一概率矩阵进行压缩，得到各数据单元对应的第二概率矩阵；根据第二概率矩阵中各概率值对应的词元，对第二词表进行对齐操作，得到第三词表；根据第三词表和第二概率矩阵，对学生模型进行蒸馏训练，得到目标语言模型，由此降低了存储成本，提升了蒸馏训练效率，而且使得据此训练的目标语言模型在保持高性能的同时，可更好地适应不同的模型架构和文本处理场景。

技术关键词

语言模型训练方法矩阵文本处理方法索引学生编码数据重构模式磁盘非暂态计算机可读存储介质机器翻译教师文本处理装置模型训练装置蒸馏处理单元关系处理器

语言模型训练方法、文本处理方法、装置、设备及介质

站点导航

APP 下载