摘要
本发明提出了一种基于对抗训练的RCT文献分类模型训练方法和系统,该方法包括:获取带有标注的指定医学文献数据集;其中,所述标注包括RCT文献、非RCT文献以及分歧文献;所述分歧文献是指多个标注者对文献是否属于RCT文献的判断不同的文献;基于所述数据集中标注为分歧文献的文献构建对抗模型,并基于所述数据中标注为RCT文献和非RCT文献的文献训练所述对抗模型;运行所述对抗模型,生成样本库,并基于所述样本库训练二分类模型;其中,所述二分类模型是用于识别文献是否属于RCT文献的机器学习模型,所述样本库中RCT文献和非RCT文献的比例满足预设的样本平衡条件。本发明提高了文献分类精度。
技术关键词
语义理解模型
二分类模型
框架特征
模型训练方法
样本
语义解析技术
机器学习模型
自然语言文本
判别规则
分类边界
模型训练系统
分支
数据
处理器
可读存储介质
关键词
指标
医学
语句
系统为您推荐了相关专利信息
语音编码器
语音解码器
方言识别方法
特征提取模块
样本
核反应堆堆芯
数字孪生方法
训练神经网络
数据实时交互
堆外探测器
训练样本数据
人脸图像检测方法
像素点
人脸图像检测装置
标签
函数型数据分析
证券交易所
集成电路产业链
编码器
企业关联关系信息