摘要
本申请涉及一种文本分析模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,应用于人工智能领域。该方法包括:获取参考模型、以及包含多个训练样本的样本集;在目标轮次对训练样本进行强化学习训练的过程中,确定训练样本中正标签相对负标签的参考学习增益;对训练样本对应的迭代模型输出正标签的第一迭代似然统计值、以及训练样本对应的迭代模型输出负标签的第二迭代似然概率进行加权统计,确定训练样本的迭代学习增益;在基于每一训练样本各自的迭代学习增益和参考学习增益,确定目标轮次的学习损失收敛的情况下,结束强化学习训练,得到参考模型对应的文本分析模型。上述方法能够提高模型的泛化能力。
技术关键词
文本分析模型
标签
样本
数值
问答模型
计算机程序产品
计算机设备
可读存储介质
处理器
训练装置
模块
存储器
对象
关系
系统为您推荐了相关专利信息
生成技术
生成安全策略
上下文语义理解
安全策略执行
日志管理系统
物流配送中心
客户需求信息
节点
物流配送路径规划
配送路径规划方法
拷贝数检测方法
密度
滑动窗口
生物信息学技术
分辨率
网络安全状态
呼吸道
人工智能模型
网络流量数据
数据存储方法