摘要
本发明公开了一种基于知识增强的无辅助模型投机推理方法,该方法首先基于分段缓存策略构建轻量级外部知识库。其次采用逐级插入与结构节点复用机制,基于输入token序列构建支持动态路径预测与上下文对齐的多分支前缀树Trie。然后基于Trie树生成树候选token路径,基于外部知识库生成库候选token路径,合并去重生成混合候选token路径,构建共享前缀的多分支树,通过大模型对多分支树中所有节点进行并行推理,并进行验证,更新Trie树,循环执行上述操作完成投机推理。本发明通全面提升无辅助模型场景下的推理性能,为大模型推理在医疗、法律等领域任务中提供更高效、更稳定的生成能力。
技术关键词
推理方法
序列
生成树
缓存策略
内存
多分支
模型场景
索引机制
路径匹配
节点更新
树状结构
标记
动态
分段
语义
依序
系统为您推荐了相关专利信息
神经网络剪枝
滤波器
遗传算法
双曲正切函数
基因
高速公路改扩建施工期
空地协同
车道
Kriging算法
路网结构
示功图数据
油井动液面
实时监测方法
载荷特征
传感设备