摘要
本发明公开一种化学结构智能提取方法及系统、计算机可读存储介质,本方法包括文档预处理、深度学习目标检测、光学字符识别、跨模态语义映射与化学结构图解析等技术流程,其核心创新在于融合光学化学结构图识别与多模态大语言模型,自动识别并理解化学结构图、化学结构编号、数据表格(生物活性及药代动力学数据)的关系,并建立化学结构图‑SMILES/SDF‑结构编号‑结构属性数据映射的自动化映射关系。该方法最终可生成标准化、结构化的化学结构信息表,显著提高提取效率和准确性,广泛适用于化学、生物医药等多个应用场景。
技术关键词
智能提取方法
光学字符识别技术
大语言模型
表格
文本
智能提取系统
可读存储介质
数据
多模态
计算机
深度映射
关系
网页界面
生物
图像增强
跨模态
识别模块
语义
系统为您推荐了相关专利信息
数据库生成系统
文本特征值
同态加密算法
列表
多模态数据库
信息管理方法
客户
线性规划模型
房间
短时傅里叶变换
大语言模型
多智能体协同
策略
生成参数
生成自然语言
模型优化系统
指令优化
大语言模型
语言模型优化方法
数据分类