摘要
本申请适用于计算机技术领域,提供了一种蛋白质语言构建方法、装置、电子设备及计算机程序产品。所述方法包括:基于二级结构信息对目标蛋白质进行切分,得到两个以上目标蛋白质片段;确定各目标蛋白质片段对应的蛋白质语言词语;基于所述各目标蛋白质片段对应的蛋白质语言词语,确定所述目标蛋白质对应的蛋白质语言语句。通过本申请更利于蛋白质语言模型捕捉蛋白质分子层面的语义信息,从而获得更好的蛋白质表示。
技术关键词
异构特征
词语
样本
语句
计算机程序产品
序列
电子设备
模块
处理器
存储器
聚类
语义
索引
分子
系统为您推荐了相关专利信息
enface图像
像素点
图像生成方法
眼底相机
线性