一种面向目标领域的大语言模型训练方法及装置

正文

推荐专利

申请号：CN202411630161

申请日期：2024-11-15

公开号：CN119537596A

公开日期：2025-02-28

类型：发明专利

摘要

本申请提供了一种面向目标领域的大语言模型训练方法及装置，该大语言模型训练方法通过在目标领域下对通用的大语言模型进行分阶段微调训练的方式，不仅可以有效地提高大语言模型的模型训练效率，还有利于提高大语言模型在处理目标领域下相关问题时的鲁棒性，使得大语言模型能够更加准确地理解和处理目标领域下的相关问题。

技术关键词

大语言模型语言模型训练方法超参数插件分词机器可读指令人工智能模型对抗性模型训练装置处理器可读存储介质终端数据处理模块意图识别样本词典

系统为您推荐了相关专利信息

换流变压器故障检测方法深度学习算法差分放大器技术电力设备检测技术

强化学习代理大语言模型学习方法评分机制指标

超参数图像分割方法对比度动态图像增强

关联挖掘方法特征提取模型节点特征基因序列

商事主体风险评估方法企业构建知识图谱识别风险