摘要
本发明公开了一种错义突变功能效应预测模型构建方法及预测方法,涉及生物信息技术领域。本发明以致病性和良性错义突变数据为基础,通过统计学指标对多种分子表型特征进行富集注释,构建用于突变功能效应预测的机器学习模型。模型融合了多个分子层级的特征信息,包括残基层面、突变层面以及蛋白质层面的综合评估指标,并基于随机森林算法进行训练与优化。本发明不仅能够精准预测致病性突变,还在癌症驱动错义突变的识别中表现出优异性能,具有良好的泛化能力和生物学可解释性,可为错义突变的致病性与致癌性识别及其分子机制研究提供坚实的技术支持。
技术关键词
表型特征
预测模型构建方法
分子
蛋白质二级结构
序列
效应预测方法
资源
多维特征向量
亚细胞定位信息
位点
标识符
随机森林
亲和力
数据
带正电荷
甲硫氨酸
检验方法
负电荷
生物信息技术