摘要
本发明涉及一种语言模型工具调用方法、装置、计算机设备和存储介质。所述方法包括:构建语言模型微调的训练数据;训练数据包括提示语句、本地函数库、问题集和答案集;问题集作为训练数据中用户角色的输入,答案集中标注的函数名称和参数、提示语句以及本地函数库的子集作为训练数据中助手角色的输入,答案集中标注的函数调用返回作为训练数据中工具角色的输入;使用训练数据对语言模型进行微调训练;其中,微调训练时,语言模型在反向传播中不计算用户角色和工具角色的损失值;采用完成微调训练的语言模型根据用户输入的问题进行推理,得到需要调用的目标函数工具。采用本方法可以提升大语言模型工具调用的识别准确率和泛化性。
技术关键词
构建语言模型
答案
数据
语句
计算机设备
自然语言
参数
多轮对话
大语言模型
模版
处理器
可读存储介质
格式
存储器
模块
策略
样本
框架
接口