摘要
本发明公开一种基于蛋白质尺寸提示的自监督学习预训练方法和系统,首先从蛋白质数据库中收集未经标注的蛋白质数据;利用尺寸提示适配器,将蛋白质尺寸信息编码为提示向量,并嵌入到蛋白质编码器中;然后基于蛋白质的图或点云表示,执行掩码预测任务完成预训练;最后,在下游任务中对预训练模型进行微调,优化其特定任务表现。本发明通过蛋白质尺寸提示显著减少了预训练和下游任务之间数据分布不一致的问题,从而提升了预训练模型的通用性和下游任务的性能。本方法具有数据高效性、模型通用性及易扩展性,适用于蛋白质功能预测、结合位点检测等多种任务。
技术关键词
预训练方法
预训练系统
预训练网络
融合蛋白质
编码器
分层方式
尺寸特征
点云
处理单元
信息编码
数据分布
模块
适配器
标签
位点
系统为您推荐了相关专利信息
乳腺癌分子亚型
二维快速傅里叶变换
特征提取模块
预测系统
医学图像分割
风力涡轮机叶片
样本
学习方法
无监督
损失函数优化