摘要
本发明公开了一种应用于数值推理任务的多维度示例选择方法和系统,涉及自然语言处理技术领域,包括:采用多个演示问题与对应的演示代码思维链组成多个训练演示示例;采用大语言模型基于各训练演示示例确定的提示回答正确率划分有序正例组和有序负例组;通过待训练的示例评分模型根据相似性、不确定性和复杂性,基于训练查询问题、有序正例组和有序负例组进行模型训练,确定训练好的示例评分模型;当确定目标查询问题时,通过训练好的示例评分模型确定目标查询问题对应的候选演示示例的候选演示评分并选取目标演示示例。基于上述方案,引入程序化思维生成示例对示例进行多维协同评估并通过组间差异优化示例评分模型,提升了示例选择的可靠性。
技术关键词
大语言模型
正确率
复杂度
数值
文本
模型训练模块
处理器
种子
计算机程序产品
自然语言
指令
计算机设备
可读存储介质
执行器
存储器
策略
样本
编码