摘要
本发明涉及一种基于自蒸馏深度学习的微生物菌株筛选方法,属于合成生物学和人工智能交叉领域。该方法通过对微生物菌株的DNA序列进行轻量化自蒸馏网络建模,高效筛选蛋白表达量高的微生物菌株,为成本与质量平衡的基因型‑表型设计提供了筛选工具。本方法包括以下步骤:对微生物菌株的DNA序列进行One‑hot二维矩阵编码和高维特征提取;利用编码后的DNA序列构建超网络拓扑架构,根据当前主导架构的可蒸馏性进行架构权重优化和采样;为了简化超网络结构并降低计算复杂度,引入一个过滤模块,用于全局优化和过滤候选操作,从而压缩潜在的架构空间;最后,将压缩后的网络架构与前一代网络架构进行策略知识蒸馏,以此将前一代架构中的知识迁移到当前架构中,从而提高了微生物菌株的蛋白表达量预测精度和效率。上述技术方案能有效利用轻量化的深度学习模型解决蛋白表达量预测与微生物菌株DNA原型设计和筛选难题,比传统基因工程方法有效降低筛选成本。
技术关键词
微生物菌株筛选方法
网络架构
DNA序列
蒸馏
深度学习网络
残差卷积神经网络
深度学习模型
网络拓扑架构
超网络结构
基因工程方法
参数
启发式搜索
编码
特征提取网络
筛选工具
掩码矩阵
蛋白