语言模型的训练方法、装置和非易失性存储介质

正文

推荐专利

申请号：CN202411843278

申请日期：2024-12-13

公开号：CN119849562A

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开了一种语言模型的训练方法、装置和非易失性存储介质。其中，该方法包括：将多个初始序列数据分别输入至预设的目标稀疏预测器中，输出多个初始序列数据各自对应的预测参数子集，预测参数子集中包括预设的原始语言模型中的多个层级各自对应的预测参数子集，原始语言模型用于生成文本；基于多个初始序列数据各自对应的预测参数子集，确定目标参数子集；基于预设的训练样本，调整预设的原始语言模型中对应的目标参数子集中包括的参数，得到目标语言模型，其中，训练样本中包括样本文本和与样本文本对应的生成文本。本发明解决了目前在进行语言模型训练的时候因为存在参数数量较多导致模型训练过程耗时长，效率较低的技术问题。

技术关键词

文本非易失性存储介质参数序列层级数据隐马尔可夫模型样本维特比算法计算机程序产品处理器注意力机制训练装置存储器训练器计算机设备输入模块

语言模型的训练方法、装置和非易失性存储介质

站点导航

APP 下载