摘要
本发明公开了一种面向推理大模型的难题数据合成方法及系统,方法包括:对现有数学数据集进行概念抽取,获得包含数学概念、应用场景和示例的概念实体;基于现有推理大语言模型对随机抽取的概念组进行难题合成,并生成具有长推理链形式的解答,建立候选难题数据集;采用基于规则和大语言模型验证的方法,从候选数据集中筛选出正确的难题、长推理链解答及参考答案,得到最终的难题数据集。本发明提出了一个有效的数据合成方法,可以构建质量高、难度大的数学问题,在进行长推理链解答时,有效支撑了大语言模型的训练和评测,为未来在复杂推理任务中提升模型能力提供了坚实的数据基础与技术路径。
技术关键词
概念
数学
大语言模型
难度分级方法
数据
校验模型
验证方法
场景
实体
答案
字典
策略
核心
知识点
模块
逻辑
基础
参数
系统为您推荐了相关专利信息
跌倒检测方法
机器学习分类模型
图片
二维位置信息
特征提取网络
停车场管理平台
停车场地图
泊车
地图匹配算法
车辆
成人
丙戊酸
信息数据处理终端
血药浓度监测
预测模型构建方法
报文
加密数据
数据完整性验证
数据防篡改
数据传输方法