摘要
本发明提供一种基于混合稀疏注意力神经网络的文本生成方法,涉及自然语言处理技术领域,该方法为对文本采集数据集进行分词处理,分别得到训练集、验证集和测试集;利用混合稀疏注意力机制,构建文本生成神经网络;将训练集输入文本生成神经网络,利用自回归和自编码进行训练,得到训练好的文本生成神经网络;将验证集和测试集输入训练好的文本生成神经网络,利用推理时间、显存占用和困惑度三个指标进行性能评估,得到最终的文本生成神经网络;其中,最终的文本生成神经网络用于对文本采集数据进行分析,得到文本生成结果,完成基于混合稀疏注意力神经网络的文本生成。本发明解决了长文本数据计算复杂度高和资源消耗大的问题。
技术关键词
生成神经网络
注意力神经网络
文本生成方法
注意力机制
训练集
标识符技术
生成标识符
数据
分词
矩阵
表达式
自然语言
编码
指标
复杂度
模块
索引
系统为您推荐了相关专利信息
苹果智能分拣系统
视角
智能分拣方法
图像采集装置
电气控制模块
充电站负荷预测
序列数据处理
启发式算法
可读存储介质
存储计算机程序
注意力机制
状态检测方法
强化学习算法
光缆检测系统
网络
空间数据管理方法
特征向量空间
矩阵
卷积网络模型
可视化界面
清水混凝土表面
语义分割方法
语义分割模型
像素
深度学习语义分割