摘要
本申请实施例提供了一种文本摘要生成模型的训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取文本样本的子词索引序列;对子词索引序列进行处理,得到编码张量序列;根据编码张量序列对预设的TTT‑Linear‑Transformer模型进行内循环和外循环训练,获取目标损失函数;根据目标损失函数,通过对偶形式对TTT‑Linear‑Transformer模型进行权重更新,直至TTT‑Linear‑Transformer模型收敛,得到文本摘要生成模型,文本摘要生成模型用于生成文本的摘要。本申请实施例能够提高文本摘要生成模型的性能,提高文本摘要生成的质量和效率。
技术关键词
摘要
文本
序列
编码
索引
计算机设备
模型训练模块
可读存储介质
残差学习
人工智能技术
标签
样本
训练装置
处理器
矩阵
存储器
参数
键值
系统为您推荐了相关专利信息
机械臂运动路径
RGBD图像
多视角
关键点
取景装置
器官图像分割方法
多级特征
多层感知器
二维卷积网络
图像分割系统