基于玻尔兹曼噪音多态SMILE式训练大模型的化合物活性预测

AITNT
正文
推荐专利
基于玻尔兹曼噪音多态SMILE式训练大模型的化合物活性预测
申请号:CN202510185355
申请日期:2025-02-20
公开号:CN120048388A
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种基于玻尔兹曼噪音多态SMILE式训练大模型的化合物活性预测方法,属于计算化学与人工智能交叉领域。方法包括:从Tox21数据集筛选高质量化合物活性数据,通过化学多态性将单条SMILE式扩展为500条异构式;基于生理热力学条件生成玻尔兹曼噪音修正pEC50值,构建多态性训练数据集;采用DORA技术对大型语言模型进行参数高效微调,目标为最小化预测误差。本发明的创新点在于:(1)通过化学多态性扩展实现数据增强,解决小样本学习问题;(2)引入玻尔兹曼噪音模拟生理环境下分子相互作用的不确定性;(3)结合动态低秩适配技术,在保持模型泛化能力的同时提升预测精度。实验表明,本方法在测试集上的MAE显著优于传统QSAR模型。
技术关键词
活性预测方法 微调技术 噪音值 异构 数据 大语言模型 模式匹配 预测误差 生理 工具包 分子 动态 参数 训练集 矩阵 药效 语义 立体 策略 标签
系统为您推荐了相关专利信息
1
一种水稳层压实度实时检测方法及系统
实时检测方法 编码器 参数 生成特征向量 学习控制技术
2
用于版图处理的方法、设备和介质
版图图案 版图图形 光学邻近效应修正 特征提取模型 处理单元
3
基于思维链的生产资源调度方法、装置、设备及存储介质
资源调度方法 推理技术 决策 文本 非暂态计算机可读存储介质
4
温度估算方法及相关装置
电子控制单元 工况 温度补偿系数 温度估算方法 数据拟合模型
5
一种基于TOPSIS法的肿瘤类器官药物敏感性评价方法
肿瘤类器官 敏感性评价方法 指标 TOPSIS算法 检测细胞活力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号