摘要
本发明涉及一种推理数据合成方法和系统,其中,方法包括:获取数学大语言模型,在模型训练过程中,通过问题微调方法在数学大语言模型利用预设数据集进行问题微调,得到经过问题微调方法处理后的数学大语言模型;通过经过问题微调方法处理后的数学大语言模型生成样本问题;通过问题偏好优化方法对样本问题进行优化,再将优化后的样本问题再对经过问题微调方法处理后的数学大语言模型进行训练;将经过问题微调方法和问题偏好优化方法处理后的数学大语言模型作为问题生成器,并对所述问题生成器生成的问题进行过滤;对每个过滤后的问题生成相应的回答以合成推理数据。本发明的推理数据合成方法不仅能保证数据质量,还能降低生成成本、提高生成效率。
技术关键词
大语言模型
微调方法
数学
样本
数据
处理器
过滤模块
可读存储介质
存储器
电子设备
字符
语义
参数
计算机
策略
标记
序列
系统为您推荐了相关专利信息
伯努利方程
分子动力学模拟方法
深度学习模型
纳米颗粒
流量预测方法
数字化变电站
火灾预警方法
辐射传感器
数据处理模块
预警模块