摘要
本发明涉及光计算与人工智能交叉领域,具体为一种支持原位训练的光电混合神经网络架构。该架构包括光学线性计算单元、光电非线性计算单元、探测单元与权重更新单元。通过级联的Mach‑Zehnder干涉仪阵列实现矩阵向量乘法,利用其前向与反向传播方向对应的传输矩阵互为转置的特性,实现同一硬件结构在前向传播与反向传播过程中的功能切换。通过探测单元获取前向传播的预激活值和反向传播的梯度,并由权重更新单元计算梯度并更新权重参数,从而实现光学神经网络的原位训练。该架构支持在光学硬件中直接执行前向传播和误差反向传播,克服了传统光学神经网络训练依赖通用电子计算机的问题,具备高速、结构紧凑和高可扩展性等优点。
技术关键词
神经网络架构
探测单元
干涉仪阵列
光电
非线性
矩阵向量乘法
光信号
误差反向传播
原位
可调衰减器
神经网络训练
平衡探测器
生成控制信号
电子计算机
数模转换器
模数转换器
系统为您推荐了相关专利信息
序列标注模型
信息抽取方法
时间序列特征
非暂态计算机可读存储介质
滑动窗口
模式预测方法
注意力
序列
运动状态信息
卷积特征