摘要
本发明提供了一种生物模型的训练方法及生物序列的处理方法,可以应用于人工智能技术领域。该生物模型的训练方法包括:根据蛋白质序列数据集和核糖核酸序列数据集按照预设输入格式构建蛋白质‑核糖核酸序列对,蛋白质‑核糖核酸序列对包括预设提示词;利用预设分词器对蛋白质序列数据集和核糖核酸序列对进行分词处理,得到训练序列对;将训练序列对输入生物模型中,得到与训练序列对对应的预测序列对;根据预测序列对、训练序列对和预设提示词训练生物模型,得到训练后的生物模型。通过本方法可以实现同时理解和生成蛋白质及核糖核酸序列,为下游应用对接提供基础。
技术关键词
序列
核糖核酸
生物
矩阵
字词
注意力
多任务
分词
人工智能技术
数据
字符
格式
编码
基础
系统为您推荐了相关专利信息
图像表征方法
纳米薄膜材料
原位
图像分割算法
矩阵
设备通信
网络拓扑结构
实时通信
基准
大数据分析技术
拓扑映射方法
三维仿真模型
功能块
分层
实时数据
类风湿关节炎患者
智能评估系统
多普勒超声
编码向量
图像处理