摘要
本发明实施例涉及人工智能技术领域,公开一种模型训练方法、装置、设备及存储介质,方法为获取初始样本、初始样本的样本标签、初始样本序列及样本文本长度;基于样本文本长度确定压缩次数;在初始模型中对初始样本序列做压缩次数次压缩处理,得到压缩次数个第一文本序列;将最新一次压缩处理得到的第一文本序列作为目标序列,对多个第一文本序列进行特征融合处理得到融合序列;初始模型对目标序列、融合序列进行预测处理,得到预测值;基于预测值和样本标签调整初始模型的模型参数,得到训练后的中间模型。在模型训练中对长文本序列进行多次压缩,保留了较多重要信息且逐次缩短了模型要处理的序列的长度,使训练后的中间模型的准确性较高。
技术关键词
模型训练方法
序列
文本
训练样本集
标签
模型训练装置
编码
输入模块
池化方法
人工智能技术
处理器通信
参数
可读存储介质
存储器
风险
电子设备
指令
系统为您推荐了相关专利信息
大语言模型
专利技术
分析方法
元素
生成训练样本
时间段
风速修正模型
风力发电机
数据
通用机器学习模型
资源预测方法
注意力
长短期记忆网络
时间序列分解方法
LSTM模型