面向低资源语言的大语言模型训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202411508097

申请日期：2024-10-28

公开号：CN119539014B

公开日期：2025-11-07

类型：发明专利

摘要

本公开提供了一种面向低资源语言的大语言模型训练方法、装置、设备及介质，涉及人工智能技术领域。该方法包括：获取低资源语言数据并经预处理得到低资源语言无监督训练数据；生成低资源语言词表并对现有的模型进行词表扩充；根据低资源语言无监督训练数据结合第一低秩自适应模块对词表扩充后的模型进行无监督预训练；根据低资源语言指令微调数据集结合第二低秩自适应模块对预训练后的模型进行指令微调；将高资源语言有监督语料分别输入指令微调后的模型和现有成熟模型，分别得到负例和正例数据，以此生成基于模型反馈的强化学习低资源语言数据集，并结合第三低秩自适应模块来对指令微调后的模型进行强化学习训练。

技术关键词

低资源语言大语言模型无监督语言模型训练方法数据指令机器翻译技术模型训练装置处理器扩充模块迁移方法挖掘方法人工智能技术评估算法参数多语言存储装置可读存储介质

面向低资源语言的大语言模型训练方法、装置、设备及介质

站点导航

APP 下载