摘要
本申请公开了一种模型超参数的确定方法、装置、电子设备及介质,该方法包括:获取预先构建的初始序列模型和目标大模型;通过指定优化算法迭代搜索目标大模型的超参数空间,以便基于超参数空间构建标签数据序列;通过标签数据序列对初始序列模型进行监督学习训练,得到目标序列模型;通过目标序列模型,确定目标大模型的目标超参数。由此,通过指定优化算法获取包括超参数标签的标签数据序列,并通过标签数据序列对初始序列模型进行监督学习训练,使得初始序列模型学习到指定优化算法的超参数推荐策略,从而可以直接使用目标序列模型快速且准确地确定目标大模型的超参数。
技术关键词
模型超参数
序列
多层注意力机制
标签
算法
数据
电子设备
处理器
可读存储介质
指令
模块
存储器
计算机
策略
编码
程序
系统为您推荐了相关专利信息
通信链路
干扰抑制技术
数据通信方法
启发式规则
频谱特征
协调控制策略
发动机燃油消耗量
序列二次规划算法
序列二次规划法
控制策略模型
旋翼无人机
空气动力学模型
群灰狼优化算法
旋翼空气动力学
模糊控制方法
多模型
仿真方法
机器学习算法
数据采集网络
氢燃料电池