摘要
本发明公开一种藏语大语言模型微调方法和装置、系统、存储介质,包括:步骤S1、获取TIFD数据集;步骤S2、根据TIFD数据集微调藏语大语言模型;其中,通过LoRA微调对基座模型的权重矩阵注入低秩增量。采用本发明的技术方案,解决藏语数据稀缺场景下模型微调成本高、效率低的问题;提升藏语大语言模型对复杂语法结构和文化术语的生成准确性。
技术关键词
大语言模型
微调方法
微调装置
注意力机制
微调系统
基座
语法结构
数据
动态
处理器
矩阵
嵌套
存储器
模式
术语
模块
场景
系统为您推荐了相关专利信息
语音识别模型
梅尔频率倒谱系数
文本
快递包裹
列表
时间序列图像
全卷积神经网络
林区
注意力机制
注意力编码器
电池缺陷检测方法
神经网络模型
通道注意力机制
卷积模块
基础
图像生成方法
服装
预训练模型
融合特征
图像生成程序
多模态学习方法
编码器参数
融合特征
客户端
标签特征