摘要
本发明提供一种基于代码语言模型的理工科解题方法、装置及电子设备,其中的方法包括:获取待进行解答的理工科题目;基于预先训练的代码语言模型以及代码解释器,根据理工科题目,生成目标解答结果;其中,代码语言模型基于预训练模型通过理工科题目样本及其对应的代码化解答结果样本构成的训练样本数据集进行微调得到。通过代码语言模型同时生成理工科题目的自然语言推理过程和代码计算推演过程,并在生成目标解答结果的过程中调用代码解释器来执行目标代码块,以辅助最终解答结果的生成,此过程充分发挥了代码语言模型的工具调用能力,缓解了算法本身容易收到模型幻觉影响而导致最终生成结果准确度不高的难题,有效提升了代码语言模型在理工科题目上的推理能力,进而提升了对理工科题目的解答准确度。
技术关键词
代码解释器
解题方法
训练样本数据
预训练模型
非暂态计算机可读存储介质
生成代码
自然语言推理
缓冲
电子设备
处理器
生成随机
存储器
模块
算法
程序