摘要
本发明提供一种基于transformer的人工智能模型、系统及装置,其中模型包括transformer解码器,所述transformer解码器包括若干层的第一处理层和若干层的第二处理层,所述第一处理层包括多头自注意力层和第一位置感知前馈网络层;所述第二处理层包括掩码多头自注意力层、多头注意力层和第二位置感知前馈网络层,所述第一处理层的输出接入所述多头注意力层的输入;所述transformer解码器的输出端用于连接GPT2生成器,所述GPT2生成器包括第一归一化层、第二多头自注意力层、全连接层、线性层和softmax层。本发明能够融合后的模型的每个神经网络层都可以独立地进行计算,因而使得系统更具普适性。
技术关键词
人工智能模型
注意力
解码器
人工智能系统
位置编码器
文本
纠错模块
人工智能装置
生成图文
历史会话
文章
输入设备
图片
计算机
线性
样本
输出端
系统为您推荐了相关专利信息
动态关系图谱
关联分析方法
源节点
风险传播模型
关联分析装置
交叉注意力机制
语音特征
文本
自定义关键词
自动语音识别
时序特征
残差矩阵
计算机执行指令
服务器异常检测
编码器
跟随系统
人体重识别
匈牙利算法
卡尔曼滤波
注意力机制