一种基于本地大语言模型材料数据抽取与数据库构建方法

正文

推荐专利

申请号：CN202511048844

申请日期：2025-07-29

公开号：CN120877994A

公开日期：2025-10-31

类型：发明专利

摘要

一种基于本地大语言模型材料数据抽取与数据库构建方法，它涉及材料数据抽取和数据库构建方法。它是要解决现有的文献分析工具从科学文献中自动提取的数据有限、提取能力弱、文献适配性差的技术问题。本方法：首先，对收集的论文进行文本格式转换，并对转换后的文本进行文本清理；其次，调用本地部署大语言模型接口，构建提示工程；随后，进行正则抽取，提取以“材料‑属性‑数值”为格式的结构化三元组；最后，汇总数据存入MySQL数据库。本方法能够显著缩短数据库建立时间，减少人工整理成本，可高通量进行催化剂筛选，可用于材料的智能设计与研发领域。

技术关键词

数据库构建方法三元组大语言模型电催化析氢材料文本支持用户自定义管理工具 GPU服务器格式语义数据库结构数据库更新字符批量材料特征脚本分析工具自然语言数值

系统为您推荐了相关专利信息

一种大语言模型处理系统及会话处理方法

节点调度器硬件加速器内存多轮会话

基于AI、RPA和AI Agent的文档处理方法、装置和设备

关键字自然语言文本大语言模型序列标注模型光学字符识别

动力电池容量预测方法、计算机设备及可读存储介质

电池容量预测方法矢量特征电化学阻抗谱三元组容量预测模型

基于人工智能算法的城市扩张区域变电站布局方法和系统

历史负荷数据变电站大语言模型人工智能算法配电网网架结构

基于强化学习策略模型的可控文本水印嵌入方法

强化学习策略水印嵌入方法水印检测器后处理模块比特流

一种基于本地大语言模型材料数据抽取与数据库构建方法

站点导航

APP 下载