摘要
本发明属于压缩大语言模型推理长度技术领域,公开一种基于逐步探索和偏好优化平衡大模型中推理长度和准确性方法。采用了逐步探索机制和长短切换采样策略,使大模型能够逐步生成多样化的推理路径。这些路径将被评估并用于构建偏好对,进而训练两个孪生模型,一个优化推理准确性,另一个优化更短的推理过程。最终,通过插值这两个模型的参数,得到一个集成模型。多个数学推理数据集和骨干模型的实验结果表明,本发明显著减少了推理长度,大约减少了30‑50%,同时保持并进一步的提高了推理准确性。
技术关键词
准确性方法
轨迹
参数
答案
长度技术
三元组
合并方法
大语言模型
策略
样本
精度
数据
数学
机制
阶段
指令
系统为您推荐了相关专利信息
图像编码器
加权损失函数
模型训练方法
连续特征
标签编码器
信息交互模型
蝙蝠算法
信息交互方法
信息交换服务
需求响应信息
神经网络系统
图像处理方法
生成对抗网络
深度卷积神经网络
超参数
运载火箭电源
监控方法
网络特征
长短期记忆网络
滑动窗口方法