摘要
本公开提供了一种面向低资源语言的大语言模型训练方法、装置、设备及介质,涉及人工智能技术领域。该方法包括:获取低资源语言数据并经预处理得到低资源语言无监督训练数据;生成低资源语言词表并对现有的模型进行词表扩充;根据低资源语言无监督训练数据结合第一低秩自适应模块对词表扩充后的模型进行无监督预训练;根据低资源语言指令微调数据集结合第二低秩自适应模块对预训练后的模型进行指令微调;将高资源语言有监督语料分别输入指令微调后的模型和现有成熟模型,分别得到负例和正例数据,以此生成基于模型反馈的强化学习低资源语言数据集,并结合第三低秩自适应模块来对指令微调后的模型进行强化学习训练。
技术关键词
低资源语言
大语言模型
无监督
语言模型训练方法
数据
指令
机器翻译技术
模型训练装置
处理器
扩充模块
迁移方法
挖掘方法
人工智能技术
评估算法
参数
多语言
存储装置
可读存储介质