一种基于大型语言模型的酶活参数抽取方法与系统

正文

推荐专利

申请号：CN202510050672

申请日期：2025-01-13

公开号：CN119443093A

公开日期：2025-02-14

类型：发明专利

摘要

本发明提出了一种基于大型语言模型的酶活参数抽取方法与系统，属于文本信息处理和数据挖掘领域。本发明通过OCR技术将PDF格式文献转换为Markdown格式，随后利用大型语言模型结合优化的提示词自动提取关键数据；自动提取流程经过严格的提示词优化和后处理操作，确保数据的准确性和一致性；然后通过精确度和召回率验证自动提取的有效性，最终生成的酶数据库可供后续的研究和分析使用。本发明通过结合OCR技术与大型语言模型，突破了现有手动数据提取的局限，显著提升了文献解析和数据提取的自动化程度；通过提示词工程和优化的提示词设计，实现了复杂文献中的结构化数据自动提取，特别是对于酶动力学参数的精确识别和提取。

技术关键词

参数抽取方法光学字符识别抽取系统数据样本过滤模块文本黄金筛选算法基准处理器存储器信息处理突变体格式化可读存储介质程序

系统为您推荐了相关专利信息

一种基于极寒环境工况的避雷器故障类型预测方法及系统

混沌预测方法动态贝叶斯网络避雷器故障变分贝叶斯三维物理模型

一种工业设备异常检测与预警的实现方法及装置

机器可读程序实时数据采集数据处理中心工业设备运行状态数据集成技术

基于氧化脂质衍生化和机器学习模型的心力衰竭检测生物标志物的检测方法

随机森林算法模型潜在生物标志物样本碳二亚胺盐酸盐

基于机器学习的告警信息降噪方法、装置及存储介质

降噪方法运维监控技术队列降噪装置重复性

一种车载网联通信终端系统

通信终端系统通信模组控制芯片电源入口保护电路电池充放电管理电路

一种基于大型语言模型的酶活参数抽取方法与系统

站点导航

APP 下载