摘要
本发明公开了一种提高小型大语言模型高级算术能力的数据处理方法,包括:构造指令数据集并进行数据标准化处理;使用指令数据集中不同数量的算式表达式数据微调小型LLM中,微调后的小型LLM在算术测试集上测评,获取分数最高的模型使用的算式表达式数据量;采用分数最高的模型使用的算式表达式数据量的算式表达式数据与不同数量的自然语言处理数据微调小型LLM,获取平均分数最高的模型使用的自然语言处理数据量;采用获取分数最高的模型使用的算式表达式数据量的算式表达式数据、获取平均分数最高的模型使用的自然语言处理数据量的自然语言处理数据和不同数量的数学应用数据微调小型LLM,获取平均分数最高的模型使用的数学应用数据量。
技术关键词
数据处理方法
大语言模型
表达式
自然语言
数学
指令
多语言
计算器
标记
系统为您推荐了相关专利信息
代码重构方法
大语言模型
sigmoid函数
复杂度
进化算法
参数计算方法
拉普拉斯
水动力弥散系数
数学模型
地下水动力学
设备运行数据采集
工业设备
动态数据处理方法
异常信号
参数
超级电容储能
稳定控制方法
超级电容器
并网逆变器
能量分配策略