面向推理大语言模型的难题数据合成方法及系统

AITNT
正文
推荐专利
面向推理大语言模型的难题数据合成方法及系统
申请号:CN202510968271
申请日期:2025-07-14
公开号:CN120851205A
公开日期:2025-10-28
类型:发明专利
摘要
本发明公开了一种面向推理大模型的难题数据合成方法及系统,方法包括:对现有数学数据集进行概念抽取,获得包含数学概念、应用场景和示例的概念实体;基于现有推理大语言模型对随机抽取的概念组进行难题合成,并生成具有长推理链形式的解答,建立候选难题数据集;采用基于规则和大语言模型验证的方法,从候选数据集中筛选出正确的难题、长推理链解答及参考答案,得到最终的难题数据集。本发明提出了一个有效的数据合成方法,可以构建质量高、难度大的数学问题,在进行长推理链解答时,有效支撑了大语言模型的训练和评测,为未来在复杂推理任务中提升模型能力提供了坚实的数据基础与技术路径。
技术关键词
概念 数学 大语言模型 难度分级方法 数据 校验模型 验证方法 场景 实体 答案 字典 策略 核心 知识点 模块 逻辑 基础 参数
系统为您推荐了相关专利信息
1
一种人员跌倒检测方法、装置、存储介质及设备
跌倒检测方法 机器学习分类模型 图片 二维位置信息 特征提取网络
2
自动驾驶车辆与停车场管理平台数据交换处理方法和系统
停车场管理平台 停车场地图 泊车 地图匹配算法 车辆
3
一种基于机器学习的成人丙戊酸谷浓度预测模型及其应用
成人 丙戊酸 信息数据处理终端 血药浓度监测 预测模型构建方法
4
一种基于Telnet通信协议的跨安全域数据传输方法、装置、电子设备及存储介质
报文 加密数据 数据完整性验证 数据防篡改 数据传输方法
5
一种能源工业互联网容器编排安全管理系统及编排方法
业务预测模型 序列 管理系统 时间段 互联网
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号