摘要
本发明公开一种基于高效特征编码和集成学习的促炎肽识别方法,从IEDB数据库中收集人类和小鼠的PIP以及n‑PIP数据并进行数据预处理操作,获得肽序列;对所述肽序列分别进行不同方式的手动特征编码,获得不同维度的特征;将所述不同维度的特征进行整合,获得肽序列编码;基于LightGBM模型和递归式特征消除策略优化所述肽序列编码,获得高效特征;将所述高效特征分别输入若干个基学习器中进行训练并采用硬投票策略对将训练好的若干个基学习器集成,获得最终模型MultiFeatVotPIP;将待检测的肽序列输入最终模型MultiFeatVotPIP中,获得促炎肽识别结果。本发明能够提高促炎肽的识别准确度。
技术关键词
LightGBM模型
识别方法
编码
序列
XGBoost模型
学习器
GBDT模型
策略
数据
小鼠
人类
冗余
程序
参数
系统为您推荐了相关专利信息
动态界面生成方法
编码向量
意图
树数据结构
序列
消息传递机制
拓扑特征
神经网络模型
节点
溯源方法
管理系统
时间序列预测模型
数据处理模块
数据采集单元
数据采集模块