摘要
本申请公开了一种大模型推理方法、装置、设备、存储介质及计算机程序产品,涉及数据处理技术领域,该方法包括:基于高质量样本数据集生成待推理任务对应的若干个高质量思维链,高质量样本数据集为存在符合预设高质量条件的思维链的数据集;确定高质量思维链中的最优思维链数据;对最优思维链数据进行思维链删减,获得目标思维链;通过大语言模型基于目标思维链输出待推理任务对应的推理结果。本发明可以对待推理任务对应的高质量思维链中的最优思维链数据进行删减,然后通过大语言模型基于删减后获得的目标思维链进行模型推理,从而解决了现有技术中大语言模型基于长度过长的思维链进行推理时,会导致推理成本增加的技术问题。
技术关键词
大语言模型
推理方法
计算机程序产品
样本
推理装置
文本
数据处理技术
处理器
可读存储介质
模块
存储器
算法
系统为您推荐了相关专利信息
BP网络模型
拓扑识别方法
集中器
电压相位角
SOM神经网络
舞蹈服饰
推荐方法
训练深度神经网络
文本
多层感知机
生成方法
激光雷达
权重分配机制
点云
预训练模型