步骤批改大模型训练方法、作业批改方法、装置及系统

正文

推荐专利

申请号：CN202510032098

申请日期：2025-01-09

公开号：CN119416858B

公开日期：2025-05-09

类型：发明专利

摘要

本申请公开了一种步骤批改大模型训练方法、作业批改方法、装置及系统，本申请获取第一训练数据，第一训练数据至少包括题目作答数据、标注的用户作答的整题评分标签，以采用领域训练数据训练后的大模型作为初始的步骤批改大模型，针对第一训练数据中的用户作答，逐个步骤采样步骤批改大模型的输出，并至少基于采样结果和用户作答的整题评分标签，估计每个步骤批改结果准确的概率标签，如此可以无需大批量人工标注步骤级批改结果，降低了标注数据的获取成本。在此基础上可以对步骤批改大模型进行训练，得到训练后的步骤批改大模型。本申请允许在训练数据不均衡的情况下高效利用所有训练数据进行模型训练，达到兼顾步骤批改能力和评分能力的效果。

技术关键词

作业批改方法模型训练方法蒙特卡洛标签网络策略模型训练装置数据获取单元计算机程序产品处理器阶段可读存储介质存储器电子设备基座

系统为您推荐了相关专利信息

一种多旋翼投弹式灭火无人机桨叶优化设计方法

灭火无人机桨叶优化设计方法多旋翼模拟退火算法

适用弱网环境微服务分布式一致方法

约会弱网环境服务注册中心集群数据

预训练模型的微调及科学假设信息的提取方法、装置、设备、介质和产品

预训练模型预测科学文本样本适配器

一种用于多模态语义分割的混合提示架构融合方法

架构融合方法多模态混合矩阵语义模态特征

一种基于深度强化学习的海洋观测站位智能设计方法

智能设计方法深度强化学习训练深度神经网络海洋深度神经网络模型

步骤批改大模型训练方法、作业批改方法、装置及系统

站点导航

APP 下载