一种基于混合稀疏注意力神经网络的文本生成方法

AITNT
正文
推荐专利
一种基于混合稀疏注意力神经网络的文本生成方法
申请号:CN202510063782
申请日期:2025-01-15
公开号:CN119990119A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供一种基于混合稀疏注意力神经网络的文本生成方法,涉及自然语言处理技术领域,该方法为对文本采集数据集进行分词处理,分别得到训练集、验证集和测试集;利用混合稀疏注意力机制,构建文本生成神经网络;将训练集输入文本生成神经网络,利用自回归和自编码进行训练,得到训练好的文本生成神经网络;将验证集和测试集输入训练好的文本生成神经网络,利用推理时间、显存占用和困惑度三个指标进行性能评估,得到最终的文本生成神经网络;其中,最终的文本生成神经网络用于对文本采集数据进行分析,得到文本生成结果,完成基于混合稀疏注意力神经网络的文本生成。本发明解决了长文本数据计算复杂度高和资源消耗大的问题。
技术关键词
生成神经网络 注意力神经网络 文本生成方法 注意力机制 训练集 标识符技术 生成标识符 数据 分词 矩阵 表达式 自然语言 编码 指标 复杂度 模块 索引
系统为您推荐了相关专利信息
1
基于三视角图像和重量信息的小型苹果智能分拣系统及方法
苹果智能分拣系统 视角 智能分拣方法 图像采集装置 电气控制模块
2
结合POI信息的Rao-1-Informer电动汽车充电站负荷预测方法和相关装置
充电站负荷预测 序列数据处理 启发式算法 可读存储介质 存储计算机程序
3
基于逆向注意力机制的光缆浸水结冰状态检测方法
注意力机制 状态检测方法 强化学习算法 光缆检测系统 网络
4
一种基于人工智能的空间数据管理方法及系统
空间数据管理方法 特征向量空间 矩阵 卷积网络模型 可视化界面
5
基于YOLOv5模型量化清水混凝土表面气泡缺陷的语义分割方法
清水混凝土表面 语义分割方法 语义分割模型 像素 深度学习语义分割
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号