摘要
本发明提供一种基于机器学习和氨基酸序列信息的鲜味肽识别阈值预测方法,包括:获取鲜味肽数据,并对所述鲜味肽数据进行预处理;通过分子指纹、分子描述符和氨基酸矩阵对预处理后的鲜味肽数据进行数字化表征;通过皮尔森相关性、F回归、互信息和包裹式对数字化表征后的鲜味肽数据进行特征筛选,得到筛选后的分子描述符、氨基酸计数和分子指纹;通过筛选后的分子描述符、氨基酸计数和分子指纹进行构建子模型,并通过回归模型评价指标进行评价,选择效果最好的前6个子模型进行集成模型构建,集成模型通过梯度提升机模型进行拟合;通过构建好的集成模型进行鲜味肽识别阈值预测。本发明可以为大量鲜味肽进行定量预测,从而为大批量筛选鲜味肽提供定量参考。
技术关键词
阈值预测方法
描述符
梯度提升机
分子
序列
指纹
数据
非线性特征
指标
随机森林
包裹
参数
矩阵
表达式
感官
符号
变量
代表
算法
系统为您推荐了相关专利信息
计算机视觉
识别方法
桥梁模型
识别感兴趣区域
感兴趣区域图像
卫星遥感图像
时间序列模型
图像校正
分析模块
机器学习模型
数据分析服务器
医护工作站
计划
病历档案整理
信息系统
药物靶点识别方法
深度学习框架
物理化学特征
编码特征
靶标相互作用