摘要
本发明提供一种基于深度学习模型注意力机制的文本处理方法与系统,所述方法包括:获取用户输入的目标文本,所述目标文本包括用户键入文字;对所述目标文本进行向量化表达得到目标矩阵;基于预设的注意力处理机制对所述目标矩阵进行注意力计算得到注意力输出,其中,注意力处理机制包括量化降维处理和查表计算处理;基于所述注意力输出,通过多层感知机制计算得到输出文本,并将所述输出文本对外输出。本发明的基于深度学习模型注意力机制的文本处理方法与系统,不仅可以显著降低Softmax的计算开销,还可以释放显卡并行计算的计算资源,进而提升整个模型的推理效率以加速文本的生成。
技术关键词
文本处理方法
深度学习模型
注意力机制
矩阵
数据格式
查找表
文本处理系统
因子
电子设备
存储计算机程序
存储器
处理器
输出模块
可读存储介质
显卡
系统为您推荐了相关专利信息
数据完整性验证
压缩感知技术
稀疏恢复算法
延迟函数
单向哈希函数
面向电力设备
电力设备运检
模型构建方法
模型构建系统
图谱
注意力模型
多尺度特征
水印嵌入
四元数小波
图像
采集设备
虚实映射方法
矩阵
机器人基坐标系
特征点