面向推理大语言模型的难题数据合成方法及系统

正文

推荐专利

申请号：CN202510968271

申请日期：2025-07-14

公开号：CN120851205A

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种面向推理大模型的难题数据合成方法及系统，方法包括：对现有数学数据集进行概念抽取，获得包含数学概念、应用场景和示例的概念实体；基于现有推理大语言模型对随机抽取的概念组进行难题合成，并生成具有长推理链形式的解答，建立候选难题数据集；采用基于规则和大语言模型验证的方法，从候选数据集中筛选出正确的难题、长推理链解答及参考答案，得到最终的难题数据集。本发明提出了一个有效的数据合成方法，可以构建质量高、难度大的数学问题，在进行长推理链解答时，有效支撑了大语言模型的训练和评测，为未来在复杂推理任务中提升模型能力提供了坚实的数据基础与技术路径。

技术关键词

概念数学大语言模型难度分级方法数据校验模型验证方法场景实体答案字典策略核心知识点模块逻辑基础参数

系统为您推荐了相关专利信息

一种人员跌倒检测方法、装置、存储介质及设备

跌倒检测方法机器学习分类模型图片二维位置信息特征提取网络

自动驾驶车辆与停车场管理平台数据交换处理方法和系统

停车场管理平台停车场地图泊车地图匹配算法车辆

一种基于机器学习的成人丙戊酸谷浓度预测模型及其应用

成人丙戊酸信息数据处理终端血药浓度监测预测模型构建方法

一种基于Telnet通信协议的跨安全域数据传输方法、装置、电子设备及存储介质

报文加密数据数据完整性验证数据防篡改数据传输方法

一种能源工业互联网容器编排安全管理系统及编排方法

业务预测模型序列管理系统时间段互联网

面向推理大语言模型的难题数据合成方法及系统

站点导航

APP 下载