摘要
本发明提供一种基于偏好学习增强大语言模型的领域特定能力的方法及系统,包括:获取无标签数据,通过预设的领域专家模型对所述无标签数据进行推理,生成相应的输出分布;将所述输出分布输入至大语言模型,通过所述大语言模型基于输出分布生成偏好增强数据;对所述偏好增强数据进行汇总,整理为新的训练数据集,通过新的训练数据集对所述大语言模型进行微调;对微调后的大语言模型进行模型评估,基于评估结果对大语言模型进行二次调整,完成大语言模型的领域特定能力增强。本发明解决了现有大语言模型在特定领域生成文本不准确的问题。
技术关键词
大语言模型
无标签数据
非暂态计算机可读存储介质
处理器
计算机程序产品
文本
数据格式
模块
存储器
电子设备
系统为您推荐了相关专利信息
焊接缺陷检测系统
焊接缺陷检测方法
电池
分析模块
图像处理算法
供热机组
负荷预测模型
历史负荷数据
数据分析技术
电子装置
语义
大语言模型
神经网络模型
计算机程序产品
处理器
排放预测方法
神经网络模型
MLP神经网络
隧道
变量