摘要
一种基于MZI级联网络的大模型计算装置及方法,涉及模型计算技术领域。该方法通过结合光子人工智能芯片和FPGA技术,解决现有Transformer模型在运行时高能耗的问题,本发明包含三个主要组件的系统:FPGA控制模块、光计算模块和FPGA计算模块,FPGA控制模块负责信号的数模转换和时序输入,而光计算模块则用于数据的权重计算和特征提取,FPGA计算模块负责除光计算模块外的所有计算任务,该发明的主要目的是将光计算引入Transformer模型的计算中,借助光子人工智能芯片实现矩阵运算,从而在保持高性能的同时降低模型运行时的电力消耗,还结合了FPGA的计算灵活性和光学计算的高速、高效率特点,使光电混合计算成为实现低能耗Transformer模型计算的有力解决方案。
技术关键词
光子人工智能芯片
MZI级联
模型计算方法
控制模块
马赫曾德干涉仪
输入输出控制系统
模型计算技术
网络
激光器
注意力
调制器
数模转换
光强
FPGA芯片
时钟系统
线性
信号调制
脉冲