一种基于人类反馈强化学习的分层次教育出题方法及系统

AITNT
正文
推荐专利
一种基于人类反馈强化学习的分层次教育出题方法及系统
申请号:CN202511078008
申请日期:2025-08-01
公开号:CN120580116A
公开日期:2025-09-02
类型:发明专利
摘要
本发明涉及数据分析领域,尤其涉及一种基于人类反馈强化学习的分层次教育出题方法及系统,所述方法先获取出题引导信息及对应的题目参考评分,再将出题引导信息输入预设的题目生成模型中,生成候选题目集,然后,根据题目参考评分,排序生成人类偏好数据集,接着将出题引导信息和人类偏好数据集输入第一奖励模型中,预测得到符合预设目标函数的奖励分数,并将奖励分数反向传播,得到第二奖励模型,再将出题引导信息和候选题目集输入第二奖励模型和预设的评论家模型中,以驱动题目生成模型中模型参数的更新,最后,将出题引导信息输入模型参数更新后的题目生成模型中,得到实际题目集。本发明方法解决了现有技术深度理解能力不足的问题。
技术关键词
出题方法 人类 计算机程序指令 出题系统 数据 排序损失 文本 参数 估计算法 策略 存储器 处理器 因子 元素 误差
系统为您推荐了相关专利信息
1
一种基于LLM多模态数据生成的无人机抗欺骗能力提升方法
能力提升方法 无人机 图像 GPS位置信息 多模态特征
2
一种基于深度学习的城镇燃气管网水力仿真方法及装置
城镇燃气管网 仿真模型 水力 数据 节点
3
机器人自主探索建图的方法及装置
机器人本体 计算机可执行指令 场景 聚类 处理器
4
一种基于轻量级神经网络的毫米波雷达手势识别方法
轻量级神经网络 手势识别方法 雷达 动态手势 中频信号
5
基于UDP广播的虚拟现实大空间自动局域网组网方法及系统
服务端 客户端设备 大空间 组网方法 数据同步
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号