文本摘要生成模型的训练方法、装置、设备及存储介质

AITNT
正文
推荐专利
文本摘要生成模型的训练方法、装置、设备及存储介质
申请号:CN202411508050
申请日期:2024-10-25
公开号:CN119513299A
公开日期:2025-02-25
类型:发明专利
摘要
本申请实施例提供了一种文本摘要生成模型的训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取文本样本的子词索引序列;对子词索引序列进行处理,得到编码张量序列;根据编码张量序列对预设的TTT‑Linear‑Transformer模型进行内循环和外循环训练,获取目标损失函数;根据目标损失函数,通过对偶形式对TTT‑Linear‑Transformer模型进行权重更新,直至TTT‑Linear‑Transformer模型收敛,得到文本摘要生成模型,文本摘要生成模型用于生成文本的摘要。本申请实施例能够提高文本摘要生成模型的性能,提高文本摘要生成的质量和效率。
技术关键词
摘要 文本 序列 编码 索引 计算机设备 模型训练模块 可读存储介质 残差学习 人工智能技术 标签 样本 训练装置 处理器 矩阵 存储器 参数 键值
系统为您推荐了相关专利信息
1
音频生成方法、装置及其应用
音频生成方法 文本 交叉注意力机制 时序 处理器
2
一种多视角目标主动感知方法及系统、存储介质
机械臂运动路径 RGBD图像 多视角 关键点 取景装置
3
基于题库知识图谱的学习辅助方法、装置及电子设备
知识点 图谱 集群 学习辅助方法 强度
4
类器官图像分割方法及系统
器官图像分割方法 多级特征 多层感知器 二维卷积网络 图像分割系统
5
基于大模型的模型预训练方法、识别方法、设备及介质
图像块 矩阵 行人识别方法 样本 视觉
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号