一种大语言模型训练方法、系统及装置

正文

推荐专利

一种大语言模型训练方法、系统及装置

申请号：CN202511360741

申请日期：2025-09-23

公开号：CN120851132B

公开日期：2025-11-28

类型：发明专利

摘要

本发明提供了一种大语言模型训练方法、系统及装置，涉及电数字处理技术领域，包括将领域文本训练集划分为若干份训练样本集；根据每个训练样本集内分词的语义变化和频次计算得到每个训练样本集对应的训练关注度；基于所有训练关注度进行最大最小归一化得到每个样本集对应的需求系数；通过LoRA法和所有训练样本集对预设的大语言模型进行多轮微调训练，得到目标大语言模型，多轮微调训练中的秩由需求系数进行调整得到。本发明利用领域文本和通用文本作为对比。通过分析分词在两种文本中的出现频率和语义差异，判断分词是否更多用于专业领域，以此确定训练样本的专业化程度，并针对性分配计算资源进行学习能提升了计算资源分配的准确性。

技术关键词

训练样本集语言模型训练方法分词大语言模型文本语义训练集计算方法矩阵存储计算机程序训练系统参数数值训练装置模块资源分配编码数据专业

系统为您推荐了相关专利信息

基于NLP技术实现文本主题的智能提取方法及系统

主题特征提取方法智能提取方法 NLP技术句法结构

一种基于用户行为的营销预算动态分配方法

动态分配方法上下文特征点击率路径匹配序列

一种反诈宣传方法及其反诈宣传系统

宣传方法测试题显示交互界面关键词可执行程序代码

实验室危险源识别处理方法、装置、设备和介质

危险源识别文本多头注意力机制融合算法危险识别技术

多节点异构并行加速方法

并行加速方法多节点光学系统异构并行计算技术

一种大语言模型训练方法、系统及装置

站点导航

APP 下载