摘要
本发明公开了一种基于大语言模型的法律问答事实性增强方法、系统及设备,属于智能司法领域。本发明的方法首先基于大语言模型构造第一训练数据集以及第二训练数据集,使用监督微调的方法在第一训练数据集和第二训练数据集上对大语言模型基座进行微调,得到微调后的模型,利用基于难样本感知的强化学习算法对微调后的模型进行若干次迭代微调,直至达到预设的迭代轮次阈值或者模型收敛,得到法律问答模型。本发明构造了两阶段的高质量训练数据,并基于难样本感知的强化学习算法增强法律问答事实性,具有良好的应用前景。
技术关键词
大语言模型
答案
问答模型
强化学习算法
文本
三元组
指标
计算机电子设备
基座
存储计算机程序
数据获取模块
训练集
样本
编码器
语义
超参数
存储器
处理器
系统为您推荐了相关专利信息
直播间信息
超文本标记语言
自然语言
文本信息提取
直播内容分发方法
性能指标数据
异常检测方法
无监督学习
异常检测系统
软件
医疗数据处理方法
项目
训练预测模型
文本
训练样本数据
文本识别模型
残差模块
文档图像处理
电子设备
中间件