摘要
本发明属于化学物质健康风险管控的高通量筛查技术领域,公开了一种用于筛查全氟和多氟烷基物质活体毒性的方法。该方法首先利用大语言模型及嵌入模型构建体外生物测定描述的知识图谱及语义向量数据库,通过语义和知识图谱检索与特定毒性终点相关的体外生物测定,以辅助PFAS活体毒性筛查模型构建;接着在包含PFAS物质SMILES字符串数据集上,预训练Roberta模型得到PFAS Roberta模型,用于PFAS物质的特征提取;最后利用获取到的特定毒性终点活体及体外生物测定数据,以预训练的PFAS Roberta模型作为特征抽取器,构建元学习筛查模型。本发明公开的模型能更高效地进行PFAS活体毒性筛查。
技术关键词
语义向量
大语言模型
文本
筛查模型
图谱
终点
排序模型
筛选测试化合物
摘要
数据
高通量筛查
抽取器
元学习方法
编码器架构
分词
阶段
参数
序列
定义
编码方法
系统为您推荐了相关专利信息
个性化推荐系统
语义知识图谱
个性化推荐服务
多源时空数据
出行规划