摘要
本发明提供了一种基于化合物扰动转录组和蛋白序列预测化合物靶点的方法及应用,本发明创新性地结合化合物扰动转录组特征和蛋白靶点序列特征,以此作为输入特征结合深度学习模型实现对化合物靶点的预测。具体通过收集化合物的扰动转录组及其活性和非活性靶点信息数据,通过主成分分析,线性判别分析来提取转录组特征,同时使用蛋白质语言模型表示靶点蛋白特征,将化合物的转录组和靶点都转变为可学习的嵌入,利用分类模型进行训练学习二者的潜在关联,并最终用于化合物靶点预测。本发明使用外部测试集证明了该模型的较高准确性和实际应用性。本发明具有成本低、效率高和范围广的优点,能够显著提高化合物靶点发现效率,有助于加速药物的研发进程。
技术关键词
蛋白
线性变换矩阵
成分分析
计算机可执行指令
标签
数据
深度学习模型
多层感知机
序列特征
处理器
随机森林
超参数
存储器
样本
电子设备
进程
误差
系统为您推荐了相关专利信息
三维点云分类
点云特征
多层感知器
邻域特征
注意力机制
虚拟文档对象模型
画布
计算机可执行指令
解析器
在线