大模型推理引擎的参数调优方法及装置

AITNT
正文
推荐专利
大模型推理引擎的参数调优方法及装置
申请号:CN202411068588
申请日期:2024-08-05
公开号:CN118940843A
公开日期:2024-11-12
类型:发明专利
摘要
本说明书实施例披露一种大模型推理引擎的参数调优方法及装置,其中大模型推理引擎用于运行目标大模型以处理目标应用发起的推理请求。该方法包括:首先,获取多个观测样本,其中各观测样本包括一组配置参数,以及根据该组参数配置所述大模型推理引擎后,对所述目标应用的历史推理请求进行重放而确定的引擎性能指标;然后,利用所述多个观测样本初始化贝叶斯优化BO算法中的观测数据,以及,将所述BO算法中的目标函数定义为配置参数和引擎性能指标之间的映射关系,从而执行所述BO算法,得到使引擎性能指标发生优化的若干组配置参数。如此,可以实现利用BO算法适应不同上层应用关注的不同优化目标。
技术关键词
新配置参数 参数调优方法 样本 蒙特卡洛算法 训练预测模型 数据 标签 计算机 指标 定义 可读存储介质 关系 存储器 在线 处理器 离线 时延 模块
系统为您推荐了相关专利信息
1
基于情感感知表征解耦与偏移的多模态情感分析方法及产品
文本 情感分析方法 编码器 注意力 极性解码器
2
音效调节方法、音效调节多模态大模型的训练方法和设备
多模态 语义特征 音频特征 编码器模块 音乐播放场景
3
改进时间动态图神经网络的工业场景下人员动作识别方法
动作识别方法 动作识别模型 协同注意力 多尺度 训练集
4
基于深度学习的生成图像分类系统、存储介质及设备
图像分类系统 图像特征数据 通道注意力机制 特征值 非线性降维算法
5
一种基于扩散模型文本引导的红外图像生成方法
输出特征 图像生成方法 可见光图像 天气 计算机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号