一种基于化合物扰动转录组和蛋白序列预测化合物靶点的方法及应用

正文

推荐专利

申请号：CN202411934177

申请日期：2024-12-26

公开号：CN119889424B

公开日期：2025-09-30

类型：发明专利

摘要

本发明提供了一种基于化合物扰动转录组和蛋白序列预测化合物靶点的方法及应用，本发明创新性地结合化合物扰动转录组特征和蛋白靶点序列特征，以此作为输入特征结合深度学习模型实现对化合物靶点的预测。具体通过收集化合物的扰动转录组及其活性和非活性靶点信息数据，通过主成分分析，线性判别分析来提取转录组特征，同时使用蛋白质语言模型表示靶点蛋白特征，将化合物的转录组和靶点都转变为可学习的嵌入，利用分类模型进行训练学习二者的潜在关联，并最终用于化合物靶点预测。本发明使用外部测试集证明了该模型的较高准确性和实际应用性。本发明具有成本低、效率高和范围广的优点，能够显著提高化合物靶点发现效率，有助于加速药物的研发进程。

技术关键词

蛋白线性变换矩阵成分分析计算机可执行指令标签数据深度学习模型多层感知机序列特征处理器随机森林超参数存储器样本电子设备进程误差

一种基于化合物扰动转录组和蛋白序列预测化合物靶点的方法及应用

站点导航

APP 下载