基于ClusterCentroids欠采样技术预测多种赖氨酸修饰位点的方法

正文

推荐专利

申请号：CN202410853387

申请日期：2024-06-28

公开号：CN118692563A

公开日期：2024-09-24

类型：发明专利

摘要

本发明属于人工智能算法应用‑生物序列识别领域，涉及基于ClusterCentroids欠采样技术预测多种赖氨酸修饰位点的方法。首先，通过数据收集、整合与去冗余，优化特征空间，减少冗余信息，获得了一批存在显著类别不均衡问题的蛋白质序列作为输入数据。接着，使用多标签具体位置三联氨基酸倾向特征提取算法对蛋白质序列进行特征编码，获得输入特征矩阵。而后，采用ClusterCentroids框架辅以MinibatchKmeans算法计算多数类的聚类中心对不平衡数据集进行处理，确保模型在各种修饰位点预测上都能有很好的预测效果。本发明使用可通过说明书和已开源的代码实现预测多个赖氨酸翻译后修饰位点。

技术关键词

赖氨酸采样技术数据位点三联依赖特征特征提取模块构建卷积神经网络分类模型构建神经网络架构多标签 ReLU函数特征提取算法初始聚类中心人工智能算法样本序列识别冗余

系统为您推荐了相关专利信息

基于水下相机及水听器的运行目标声信号采集系统

水听器信号采集系统水下相机叠加特征干扰特征

颜色表提取神经网络模型构建、颜色表提取方法及系统

颜色生成重构图像控制点神经网络模型构建图像编码器

一种卷烟产品包装机生产质量的评价方法、装置及设备

卷烟产品卷烟包装机拉伸聚丙烯薄膜评价方法权重模型

数据查询方法、装置、电子设备及存储介质

标签数据查询方法关系资产节点

一种面向硬质材料激光加工任务的排产方法与装置

激光加工过程决策排产模型阶段变量

基于ClusterCentroids欠采样技术预测多种赖氨酸修饰位点的方法

站点导航

APP 下载