摘要
本公开涉及一种获取训练样本的方法、装置、介质、设备及产品,该方法包括:通过第一大语言模型获得第一问题对应的第一信息,展示第一信息;响应于接收到用户对第一推理过程信息的第一交互指令,获取第二推理过程信息;获取第二代码信息对应的第一执行结果信息;将第一问题、第二推理过程信息和第一执行结果信息返回第一大语言模型,并重新执行通过第一大语言模型获得第一问题对应的第一信息的步骤至展示第一信息的步骤,直至第一信息包括第一答案信息;根据第一问题、第一答案信息、第二推理过程信息和第一执行结果信息,获取用于第二大语言模型的训练样本。采用上述方案,可以得到准确的训练样本,增强训练后的第二大语言模型对问题的推理能力。
技术关键词
大语言模型
答案
指令
计划
编辑
存储器
存储装置
标签
模块
计算机程序产品
介质
电子设备
处理器
标记
系统为您推荐了相关专利信息
计算机程序指令
芯片
计算机程序产品
关系
存储计算机程序
汉字智能输入
字符
信息推荐方法
语义向量
文本技术
多关节机械臂系统
视觉伺服控制方法
伺服控制器
指令滤波器
透视投影矩阵
指令下发系统
历史气象数据
终端设备
大语言模型
作业设备
城市排水系统
SWMM模型
城市排水管网
情景
控制策略