基于三段式GRPO强化学习的裁判文书摘要生成方法

AITNT
正文
推荐专利
基于三段式GRPO强化学习的裁判文书摘要生成方法
申请号:CN202510758056
申请日期:2025-06-09
公开号:CN120278126B
公开日期:2025-09-09
类型:发明专利
摘要
本发明实施例中提供了一种基于三段式GRPO强化学习的裁判文书摘要生成方法,属于数据处理技术领域,具体包括:步骤1,建模三段式思维链;步骤2,根据三段式思维链对原始裁判文书数据集进行数据蒸馏与分层,得到不同类型的数据集,其中,所述类型包括高相关性、中相关性和低相关性;步骤3,使用高相关性数据集对大语言模型进行SFT监督微调训练;步骤4,利用全部数据集对训练后的大语言模型进行多阶段GRPO强化学习训练,得到目标模型;步骤5,将目标裁判文书输入目标模型,生成目标摘要。通过本发明的方案,提高了摘要生成效率、精准度和适应性。
技术关键词
裁判文书 摘要生成方法 多阶段 实体 大语言模型 bert模型 预训练语言模型 格式 模板 三段式结构 数据处理技术 生成标签 表达式 分层 策略 蒸馏
系统为您推荐了相关专利信息
1
基于大模型驱动的自适应检索方法及装置
大语言模型 线性规划算法 检索方法 可读存储介质 检索装置
2
一种图谱构建方法和装置、电子设备及存储介质
图谱构建方法 资源 节点 实体 标签
3
一种松茸子实体分离培育菌种的方法
时间预测模型 培养液 菌种培养 pH值 松茸菌丝
4
基于智能体的孕产信息问答方法及系统
智能体交互 医疗知识图谱 信息问答方法 语义向量 医学
5
一种基于数据增强的多模态知识图谱融合方法、系统、设备及介质
视觉特征 实体 知识图谱融合方法 多模态特征 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号