摘要
本发明属于人工智能算法应用‑生物序列识别领域,涉及基于EPDCC技术识别多种赖氨酸修饰位点的方法。本发明能够同时预测多种赖氨酸修饰位点。本发明还特别解决了先前技术未能充分考虑的修饰之间的串扰问题,从而提高了预测的准确性和可靠性。通过将离散数据拟合成函数型数据进行聚类来平衡数据集,本发明采用的极值点偏差补偿聚类欠采样算法有效减少了模型训练过程种对多数类的偏向。通过构建多尺度数据,结合序列信息特征和氨基酸理化性质特征,丰富了数据语义,显著提升了模型对赖氨酸翻译后修饰位点的预测性能。
技术关键词
赖氨酸
卷积神经网络分类
位点
极值
初始聚类中心
生成特征
样本
矩阵
三联
卷积神经网络训练
数据分类
数据特征提取
多标签
人工智能算法
样条
结点
序列识别
系统为您推荐了相关专利信息
光刻胶剥离液
丙二醇甲醚醋酸酯
有机胺
剥离光刻胶
去离子水
径向基神经网络
角估计方法
初始聚类中心
卡尔曼滤波模型
导航系统
电能表状态
电能表故障
传感器健康状态
多模态传感器
物理