一种基于逐步探索和偏好优化平衡大模型中推理长度和准确性方法

正文

推荐专利

申请号：CN202510754777

申请日期：2025-06-06

公开号：CN120579640A

公开日期：2025-09-02

类型：发明专利

摘要

本发明属于压缩大语言模型推理长度技术领域，公开一种基于逐步探索和偏好优化平衡大模型中推理长度和准确性方法。采用了逐步探索机制和长短切换采样策略，使大模型能够逐步生成多样化的推理路径。这些路径将被评估并用于构建偏好对，进而训练两个孪生模型，一个优化推理准确性，另一个优化更短的推理过程。最终，通过插值这两个模型的参数，得到一个集成模型。多个数学推理数据集和骨干模型的实验结果表明，本发明显著减少了推理长度，大约减少了30‑50%，同时保持并进一步的提高了推理准确性。

技术关键词

准确性方法轨迹参数答案长度技术三元组合并方法大语言模型策略样本精度数据数学机制阶段指令

系统为您推荐了相关专利信息

模型训练方法及其装置

图像编码器加权损失函数模型训练方法连续特征标签编码器

一种高光效LED发光半导体及其制备方法

荧光粉色坐标值半导体波长偏差

基于改进的蝙蝠算法的电网省地信息交互方法

信息交互模型蝙蝠算法信息交互方法信息交换服务需求响应信息

一种基于神经网络系统的图像处理方法

神经网络系统图像处理方法生成对抗网络深度卷积神经网络超参数

一种运载火箭电源数据传输与监控方法、装置及存储介质

运载火箭电源监控方法网络特征长短期记忆网络滑动窗口方法

一种基于逐步探索和偏好优化平衡大模型中推理长度和准确性方法

站点导航

APP 下载