摘要
本申请提供了一种挖掘保险判责规则的方法及装置。涉及数据处理技术领域,判责大模型基于判责规则集,对目标批次的判责数据集包括的案件的费用项进行判责,得到判责结果并与判责标签比对;若比对存在差异生成错误反馈;规则梳理大模型基于错误反馈对判责规则集进行修正,对输出随机采样,根据奖励函数确定最优的判责规则集并更新;将下一批次的判责数据集作为新的目标批次的判责数据集重复上述步骤,直至完成目标数量批次的判责数据集的迭代训练;基于构建偏好数据集和直接偏好优化算法更新规则梳理大模型,并重复上述步骤直至完成目标轮数的循环,得到最终的判责规则集。如此形成的判责规则能够被判责大模型理解方便用于实际案件的判责。
技术关键词
规则集
案件
标签
数据验证
指令
数据处理技术
算法
处理单元
参数
系统为您推荐了相关专利信息
交互式阅读装置
阅读方法
控件
主题
计算机程序产品