评阅模型训练方法、评阅方法和装置

正文

推荐专利

评阅模型训练方法、评阅方法和装置

申请号：CN202411951368

申请日期：2024-12-27

公开号：CN119849503A

公开日期：2025-04-18

类型：发明专利

摘要

本发明提供一种评阅模型训练方法、评阅方法和装置，其中方法包括：根据第一样本数据集中的第一样本数据，对大型语言模型进行无监督训练，得到第一语言模型；根据第二样本数据集中的第二样本数据和各第二样本数据对应的评分标签和评语标签，对第一语言模型进行有监督训练，得到第二语言模型；根据第三样本数据集中的第三样本数据和各第三样本数据对应的评分标签，对第二语言模型进行强化学习训练，得到评阅模型；第一样本数据集中的样本数据数量和第三样本数据集中的样本数据数量均大于第二样本数据集中的样本数据数量。本发明实现通过少量评语标签即可有效训练出具备较高评阅质量的评阅模型，有效降低了标注成本，同时提高了评阅的质量。

技术关键词

样本模型训练方法数据训练语言模型评阅方法标签无监督非暂态计算机可读存储介质模型训练装置答案序列处理器存储器电子设备

系统为您推荐了相关专利信息

基于多模态数据融合和多任务学习的供水管网声泄漏监测方法及装置

泄漏监测方法多模态数据融合多任务供水管特征提取器

一种面向石化能源海运行业的大模型驱动智能标书生成方法及系统

标书生成系统标书生成方法知识图谱构建深度学习语言模型语义关联度

一种运动功能等级评估系统

等级评估系统运动功能评估运动学特征脑网络特征血红蛋白

一种应用于智能平台的数据完整性验证方法和系统

平衡方法数据完整性验证多分支链表智能平台

一种构网型控制优化方法

控制优化方法动态调整机制控制优化装置邻域控制参数优化方法

评阅模型训练方法、评阅方法和装置

站点导航

APP 下载