摘要
本发明公开了一种基于玻尔兹曼噪音多态SMILE式训练大模型的化合物活性预测方法,属于计算化学与人工智能交叉领域。方法包括:从Tox21数据集筛选高质量化合物活性数据,通过化学多态性将单条SMILE式扩展为500条异构式;基于生理热力学条件生成玻尔兹曼噪音修正pEC50值,构建多态性训练数据集;采用DORA技术对大型语言模型进行参数高效微调,目标为最小化预测误差。本发明的创新点在于:(1)通过化学多态性扩展实现数据增强,解决小样本学习问题;(2)引入玻尔兹曼噪音模拟生理环境下分子相互作用的不确定性;(3)结合动态低秩适配技术,在保持模型泛化能力的同时提升预测精度。实验表明,本方法在测试集上的MAE显著优于传统QSAR模型。
技术关键词
活性预测方法
微调技术
噪音值
异构
数据
大语言模型
模式匹配
预测误差
生理
工具包
分子
动态
参数
训练集
矩阵
药效
语义
立体
策略
标签
系统为您推荐了相关专利信息
实时检测方法
编码器
参数
生成特征向量
学习控制技术
版图图案
版图图形
光学邻近效应修正
特征提取模型
处理单元
资源调度方法
推理技术
决策
文本
非暂态计算机可读存储介质
电子控制单元
工况
温度补偿系数
温度估算方法
数据拟合模型
肿瘤类器官
敏感性评价方法
指标
TOPSIS算法
检测细胞活力