摘要
本发明提供了一种生物酶催化功能关键特征筛选方法装置、电子设备及存储介质。获取生物酶特征和酶催化活性;采用基于随机森林算法的递归特征消除法进行特征选择,筛选出生物酶关键特征;利用筛选出生物酶关键特征,训练随机森林模型,获取基于最优超参数值的随机森林模型;将待测样本生物酶关键特征输入至基于最优超参数值的随机森林模型中,获取该样本生物酶的催化活性预测值,基于该值定量计算每一关键特征对催化活性的贡献值。该方法可以从数以亿计的生物酶结构、电荷等特征中筛选出影响生物酶催化功能的关键特征,利用沙普利加性解释算法揭示生物酶关键特征与催化功能之间的定量关系,为设计高催化活性和高选择性的工业生物酶提供指导。
技术关键词
随机森林模型
特征筛选方法
特征选择
特征筛选装置
生物酶结构
构象数目
可视化软件
调参方法
样本
库仑定律
模型训练模块
电子设备
存储计算机程序
算法
分子
数据
可读存储介质
电场
系统为您推荐了相关专利信息
验证系统
多模态融合技术
肺部疾病诊断
数据管理模块
个人隐私信息
数据安全传输系统
气象监测设备
车辆状态信息
端口
深度信念网络模型
车辆调度优化方法
数据挖掘技术
充电桩控制系统
数据交换协议
可视化界面
疾病预测装置
标志物
通用型
随机森林模型
核苷酸
多模型
随机森林模型
融合方法
站点观测数据
双线性插值方法