摘要
本发明涉及一种面向特定专业领域的大语言模型对齐方法,该方法基于数据集构建流水线、监督微调技术以及文献推荐模块实现,旨在增强大语言模型在特定领域的理解与表达能力。首先,在数据集构建阶段,通过请求高级大语言模型将目标领域划分为若干个子领域,并针对各类任务场景为所有子领域生成训练数据集。然后,在训练阶段通过监督微调技术对目标模型进行优化,使其能够适应专业领域的特定任务。最后,通过文献匹配模块为用户输入的问题提供真实且准确的参考文献。本发明所述面向特定专业领域的大语言模型对齐方法能够在较小成本下,显著提升大语言模型在专业领域任务中的性能。
技术关键词
对齐方法
大语言模型
专业
答案
文本
微调技术
算法
生成训练样本
生成训练数据
代表
阶段
匹配模块
参数
变量
流水线
场景