摘要
本申请涉及一种文本分析模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,应用于人工智能领域。该方法包括:获取参考模型、以及包含多个训练样本的样本集;针对样本集中的每一训练样本,在目标轮次使用训练样本进行强化学习训练的过程中,确定训练样本对应的迭代模型相对参考模型的正标签学习增益、以及训练样本对应的迭代模型相对参考模型的负标签增益统计值;在各正标签学习增益和各负标签增益统计值,确定目标轮次的学习损失收敛的情况下,结束强化学习训练,得到参考模型对应的文本分析模型。其中,训练样本包含待分析文本、待分析文本的负标签以及待分析文本的正标签。上述方法能够提高模型的泛化能力。
技术关键词
文本分析模型
标签
样本
问答模型
计算机设备
计算机程序产品
模型更新
可读存储介质
处理器
训练装置
存储设备
模块
存储器
参数
对象
系统为您推荐了相关专利信息
视频动作识别方法
全局特征融合
通道注意力机制
融合特征
网络
分布预测方法
南极磷虾
随机森林模型
深度学习数据
分辨率
玩家
人机交互界面
显示虚拟场景
机器学习模型
虚拟对象