步骤批改大模型训练方法、作业批改方法、装置及系统

AITNT
正文
推荐专利
步骤批改大模型训练方法、作业批改方法、装置及系统
申请号:CN202510032098
申请日期:2025-01-09
公开号:CN119416858B
公开日期:2025-05-09
类型:发明专利
摘要
本申请公开了一种步骤批改大模型训练方法、作业批改方法、装置及系统,本申请获取第一训练数据,第一训练数据至少包括题目作答数据、标注的用户作答的整题评分标签,以采用领域训练数据训练后的大模型作为初始的步骤批改大模型,针对第一训练数据中的用户作答,逐个步骤采样步骤批改大模型的输出,并至少基于采样结果和用户作答的整题评分标签,估计每个步骤批改结果准确的概率标签,如此可以无需大批量人工标注步骤级批改结果,降低了标注数据的获取成本。在此基础上可以对步骤批改大模型进行训练,得到训练后的步骤批改大模型。本申请允许在训练数据不均衡的情况下高效利用所有训练数据进行模型训练,达到兼顾步骤批改能力和评分能力的效果。
技术关键词
作业批改方法 模型训练方法 蒙特卡洛 标签 网络 策略 模型训练装置 数据获取单元 计算机程序产品 处理器 阶段 可读存储介质 存储器 电子设备 基座
系统为您推荐了相关专利信息
1
一种多旋翼投弹式灭火无人机桨叶优化设计方法
灭火无人机 桨叶 优化设计方法 多旋翼 模拟退火算法
2
适用弱网环境微服务分布式一致方法
约会 弱网环境 服务注册中心 集群 数据
3
预训练模型的微调及科学假设信息的提取方法、装置、设备、介质和产品
预训练模型 预测科学 文本 样本 适配器
4
一种用于多模态语义分割的混合提示架构融合方法
架构融合方法 多模态 混合矩阵 语义 模态特征
5
一种基于深度强化学习的海洋观测站位智能设计方法
智能设计方法 深度强化学习 训练深度神经网络 海洋 深度神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号