摘要
本申请实施例涉及数据处理技术领域,具体而言,涉及一种错误定位方法、装置、设备及存储介质,旨在快速定位大语言模型出现的错误。所述方法包括:将第一计算设备中的目标模型的每一层的目标算子对应的计算参数以及第一结果参数拷贝至第二计算设备中;通过所述第二计算设备中的深度学习框架,根据所述计算参数执行与所述目标算子相同的计算步骤,得到第二结果参数;在所述第一结果参数与所述第二结果参数之间的误差值超过预设的第一误差阈值的情况下,在所述第一计算设备与所述第二计算设备中对所述目标算子的计算步骤进行中间结果对比,确定所述目标模型中的错误位置。
技术关键词
错误定位方法
深度学习框架
参数
拷贝
备份
大语言模型
误差
数据处理技术
处理器
可读存储介质
存储器
电子设备
模块
关系
格式
计算机
系统为您推荐了相关专利信息
DQN算法
决策系统
终端设备
服务器资源管理
归一化模块
行星齿轮系统
齿轮传动系统
非线性动力学模型
刚度
齿侧间隙
抗压强度预测方法
硅酸盐水泥
玻璃体
样本
生成随机序列
电机控制系统
控制系统模型
电流
闭环控制系统
滤波误差
模型训练方法
随机梯度下降
正则化参数
客户
预测系统