摘要
本申请提出了一种基于预设Schema结构的大语言模型高效推理方法和系统,将Prompt提示和预设的Schema结构发送到大语言模型服务端并解析Schema结构的推理部分和停止条件;若Schema结构的字段之间存在关联,则进行串行推理填充,将Prompt提示与预设Schema结构的一个字段进行拼接并作为大语言模型的输入,逐个token词元生成该Schema结构的字段对应的字段值并对推理部分进行字段值填充,进行停止生成校验,若还有预设Schema结构的字段未生成字段值,则将Prompt提示与预设Schema结构的下一个字段进行拼接并重复本步骤;在所有的预设Schema结构的字段都生成字段值时输出完整的结构化数据。本申请使用一次请求预设Schema结构填充式推理,提升了大语言模型输出的鲁棒性和响应速度,能在工作流中与其他组件稳定交互。
技术关键词
大语言模型
推理方法
服务端
并行编码
字段
推理系统
计算机程序产品
符号
输出模块
鲁棒性
数据
地点
处理器
标记
系统为您推荐了相关专利信息
信息采集功能
智能客服
意图识别模型
答案
运营方法
水印
重置方法
神经网络模型训练
计算机执行指令
可信系统
网站地图
智能网络
爬虫方法
大语言模型
网络信息处理技术