一种基于大语言模型和强化学习的多干扰项生成方法

正文

推荐专利

申请号：CN202410893196

申请日期：2024-07-04

公开号：CN118760765A

公开日期：2024-10-11

类型：发明专利

摘要

本发明公开了一种基于大语言模型和强化学习的多干扰项生成方法，涉及人工智能技术领域。包括：获取EQG‑RACE数据，将EQG‑RACE数据划分为训练集和验证集；建立基于文字指令的干扰项生成模型；将训练集输入干扰项生成模型并进行有监督微调处理，得到有监督微调后的干扰项生成模型；将验证集输入有监督微调后的干扰项生成模型，根据生成结果进行排序；构建奖励模型，根据排序结果得到奖励模型的训练数据集，并计算成对排名损失；基于奖励模型和强化学习进一步训练有监督微调后的干扰项生成模型，得到最高质量的多干扰项。本发明在干扰项生成质量上达到满足现实出题需求的水平。

技术关键词

大语言模型生成方法文本解码器指令文章答案人工智能技术数据训练集格式模板线性样本矩阵参数

系统为您推荐了相关专利信息

基于近似最近邻检索算法的快速智能语音助手响应方法

智能语音助手语音特征提取初始聚类中心检索算法云端

基于分布式一致性的微电网不平衡电压补偿方法及系统

虚拟同步机分布式电源孤岛微电网电压补偿方法分布式一致性算法

一种基于ROS的四旋翼导游无人机系统及其导游辅助方法

导游无人机四旋翼结构起落架组件指令无线充电接收线圈

文案生成方法、装置、电子设备和存储介质

文案生成方法文本图像生成模型生成文案生成图文

基于P4语言和深度包检测的策略流控方法及设备

前置机系统流控方法子系统可编程交换机非暂态计算机可读存储介质

一种基于大语言模型和强化学习的多干扰项生成方法

站点导航

APP 下载