摘要
本发明涉及一种基于图灵机思想的大语言模型长度泛化数据驱动方法和设备,包括如下步骤:获取输入的问题,通过线性拓展将问题展开为包括多个线性有序步骤的思维链;在将问题展开为思维链的过程中,将操作数检索、在推理步骤中产生的基本解决方案以及逻辑控制语句作为步骤的原子状态;基于原子状态的思维链,利用大语言模型进行推理,在对每个步骤进行推理前,预先通过操作数检索获取当前步骤所涉及的操作数,实现大语言模型长度泛化数据驱动。与现有技术相比,本发明具有实现通用且有效的长度泛化数据驱动、消除潜在的捷径学习、长距离关注和推理动作解耦等优点。
技术关键词
数据驱动方法
图灵机
数据驱动系统
大语言模型
线性
注意力
语句
逻辑
远距离
电子设备
模块
程序
可读存储介质
存储器
处理器
模式
指令
计算机