一种基于逐步探索和偏好优化平衡大模型中推理长度和准确性方法

AITNT
正文
推荐专利
一种基于逐步探索和偏好优化平衡大模型中推理长度和准确性方法
申请号:CN202510754777
申请日期:2025-06-06
公开号:CN120579640A
公开日期:2025-09-02
类型:发明专利
摘要
本发明属于压缩大语言模型推理长度技术领域,公开一种基于逐步探索和偏好优化平衡大模型中推理长度和准确性方法。采用了逐步探索机制和长短切换采样策略,使大模型能够逐步生成多样化的推理路径。这些路径将被评估并用于构建偏好对,进而训练两个孪生模型,一个优化推理准确性,另一个优化更短的推理过程。最终,通过插值这两个模型的参数,得到一个集成模型。多个数学推理数据集和骨干模型的实验结果表明,本发明显著减少了推理长度,大约减少了30‑50%,同时保持并进一步的提高了推理准确性。
技术关键词
准确性方法 轨迹 参数 答案 长度技术 三元组 合并方法 大语言模型 策略 样本 精度 数据 数学 机制 阶段 指令
系统为您推荐了相关专利信息
1
模型训练方法及其装置
图像编码器 加权损失函数 模型训练方法 连续特征 标签编码器
2
一种高光效LED发光半导体及其制备方法
荧光粉 色坐标值 半导体 波长 偏差
3
基于改进的蝙蝠算法的电网省地信息交互方法
信息交互模型 蝙蝠算法 信息交互方法 信息交换服务 需求响应信息
4
一种基于神经网络系统的图像处理方法
神经网络系统 图像处理方法 生成对抗网络 深度卷积神经网络 超参数
5
一种运载火箭电源数据传输与监控方法、装置及存储介质
运载火箭电源 监控方法 网络特征 长短期记忆网络 滑动窗口方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号