摘要
本发明涉及一种基于大模型知识蒸馏的数学应用题自动解答方法,包括:将待解答数学应用题输入基于大模型的知识蒸馏模型,生成数学表达式作为解方程序列,其中,基于大模型的知识蒸馏模型包括教师模型和学生模型,教师模型基于大语言模型LLMs构建,学生模型通过教师模型生成的数据进行训练获得。本发明使用大语言模型作为教师模型,首先设计生成多方面的数学应用题进行学生模型的实际增强,其次动态评估学生模型的学习状态从而针对性生成多样的数学应用题变种,提升学生模型对数学应用题语义和场景的理解能力,解决了参数少的模型求解能力差的问题,使学生模型以极少参数量获得接近大语言模型的数学应用题求解能力。
技术关键词
自动解答方法
解码器架构
数学
大语言模型
教师
蒸馏
学生
编码器
数据
提示技术
语义
表达式
输出特征
过滤器
序列
格式
答案
参数
方程