基于三段式GRPO强化学习的裁判文书摘要生成方法

正文

推荐专利

申请号：CN202510758056

申请日期：2025-06-09

公开号：CN120278126B

公开日期：2025-09-09

类型：发明专利

摘要

本发明实施例中提供了一种基于三段式GRPO强化学习的裁判文书摘要生成方法，属于数据处理技术领域，具体包括：步骤1，建模三段式思维链；步骤2，根据三段式思维链对原始裁判文书数据集进行数据蒸馏与分层，得到不同类型的数据集，其中，所述类型包括高相关性、中相关性和低相关性；步骤3，使用高相关性数据集对大语言模型进行SFT监督微调训练；步骤4，利用全部数据集对训练后的大语言模型进行多阶段GRPO强化学习训练，得到目标模型；步骤5，将目标裁判文书输入目标模型，生成目标摘要。通过本发明的方案，提高了摘要生成效率、精准度和适应性。

技术关键词

裁判文书摘要生成方法多阶段实体大语言模型 bert模型预训练语言模型格式模板三段式结构数据处理技术生成标签表达式分层策略蒸馏

系统为您推荐了相关专利信息

基于大模型驱动的自适应检索方法及装置

大语言模型线性规划算法检索方法可读存储介质检索装置

一种图谱构建方法和装置、电子设备及存储介质

图谱构建方法资源节点实体标签

一种松茸子实体分离培育菌种的方法

时间预测模型培养液菌种培养 pH值松茸菌丝

基于智能体的孕产信息问答方法及系统

智能体交互医疗知识图谱信息问答方法语义向量医学

一种基于数据增强的多模态知识图谱融合方法、系统、设备及介质

视觉特征实体知识图谱融合方法多模态特征文本

基于三段式GRPO强化学习的裁判文书摘要生成方法

站点导航

APP 下载