摘要
本发明提供一种化合物向量数据库构建方法、化合物相似搜索方法及装置,对多个数据源的化合物结构数据进行清洗、结构编码和向量化,对每个化合物按照其分子基本性质和结构属性形成形式统一的特征向量。将特征向量通过向量数据库进行存储并建立索引,得到化合物向量数据库。在应用过程中,对于需要检索的化合物的结构数据,首先进行结构编码和向量化,再对化合物向量数据库进行查找并输出最相似的多个化合物作为检索结果,借助索引能够实现对大规模化合物数据库中化合物结构的快速、准确检索,在药物发现、材料设计等领域具有广泛的应用前景,为科研人员提供了强大的工具支持。
技术关键词
数据库构建方法
描述符
相似性搜索方法
分子
关系型数据库
JSON结构
原子技术
索引
信息处理
神经网络模型
计算机程序产品
编码
搜索算法
芳香环
指令
药物
可读存储介质
格式
系统为您推荐了相关专利信息
考勤数据
数据存储模块
智慧校园
计算机视觉
深度学习人脸识别
火电机组汽轮机
温度监测系统
智能传感器节点
多模态传感器
数据湖系统
核酸快速检测方法
固态纳米
纳米孔芯片
核酸检测系统
序列