摘要
本发明涉及计算机辅助药物设计技术领域,具体公开了用于分子虚拟筛选的集成回归模型及生成方法、预测方法,生成方法包括:从超大规模化合物库中随机选取K个分子作为训练集;训练回归模型;使用训练后的回归模型对超大规模化合物库中未选取的分子进行预测,获得综合预测结果;从综合预测结果的阳性预测池中选择预测得分最高且标准差最大的K个分子,加入训练集;再次训练回归模型;训练次数达到迭代次数,选取预测性能最好的多个的回归模型,得到集成回归模型。本发明通过在得分最高的化合物中选择预测值标准差最大的化合物进行标注,以将精力集中于那些最具挑战性或者最不确定的样本,从而提高标注效率和模型性能。
技术关键词
模型生成方法
分子
超大规模
计算机辅助药物设计技术
训练集
指纹
异构
构型
立体
格式
样本
指标
系统为您推荐了相关专利信息
交通流量预测方法
数据采集设备
补偿式
节点
邻居
车辆行驶数据
BP网络模型
时间段
一维CNN网络
训练集
漏洞风险评估方法
分类识别模型
风险评分模型
节点
漏洞扫描工具