摘要
本公开涉及光计算技术领域,尤其涉及一种智能光计算大模型训练方法与系统。其中,该方法包括:获取训练数据集,并将训练数据集中的数据输入预设大模型中,得到预测结果;基于预测结果和真实结果,通过目标损失函数确定对应的目标损失值;基于目标损失值进行反向梯度传播,确定多层感知机层对应的第一损失梯度;基于第一损失梯度,确定每个光模块层的第二损失梯度;基于每个光模块层的第二损失梯度,对每个光模块层中的参数进行更新,重复上述步骤,直至所述预设大模型收敛,得到目标大模型。本公开通过将光模块层集成到多层感知机层中,从而利用光模块层实现光学矩阵运算的高效加速,减少了计算的延迟与功耗,提高了大模型的训练效率。
技术关键词
光模块
多层感知机层
模型训练方法
数据
计算机可执行指令
计算机存储介质
网络
光计算技术
模型训练系统
处理器通信
参数
存储器
电子设备
功耗
矩阵
系统为您推荐了相关专利信息
扭矩控制策略
环境感知数据
车辆状态数据
车辆控制方法
电子稳定性控制系统
动态资源分配
多功能相机
热管理模块
特征提取网络
图像处理流水线
干扰源定位方法
稀疏阵列天线
噪声子空间
协方差矩阵向量化
噪声分量
检测定位方法
K均值聚类算法
颜色
Chrome浏览器
遥感图像预处理
通信终端
定位信号强度
无线局域网模块
海上风电场
移动通信模块