摘要
本发明提供一种化学文献关键信息自动提取方法及装置,涉及化学文献识别领域,包括:获取化学文献,将化学文献输入第一Florence‑2模型进行文本识别,获得化学文本集合;将化学文献输入改进MolScribe模型进行图片识别,获得化学图片集合;将化学文本集合输入第一大语言模型进行核心段落筛选,获得核心段落文本集合;将化学图片集合和核心段落文本集合输入第二大语言模型进行关键信息提取,获得化学关键信息。
技术关键词
信息自动提取方法
大语言模型
样本
文本识别
核心
非暂态计算机可读存储介质
图片文字识别
光学字符识别
标签
处理器
目录
模块
存储器
算法
电子设备
表格
催化剂
基团