摘要
一种基于本地大语言模型材料数据抽取与数据库构建方法,它涉及材料数据抽取和数据库构建方法。它是要解决现有的文献分析工具从科学文献中自动提取的数据有限、提取能力弱、文献适配性差的技术问题。本方法:首先,对收集的论文进行文本格式转换,并对转换后的文本进行文本清理;其次,调用本地部署大语言模型接口,构建提示工程;随后,进行正则抽取,提取以“材料‑属性‑数值”为格式的结构化三元组;最后,汇总数据存入MySQL数据库。本方法能够显著缩短数据库建立时间,减少人工整理成本,可高通量进行催化剂筛选,可用于材料的智能设计与研发领域。
技术关键词
数据库构建方法
三元组
大语言模型
电催化析氢材料
文本
支持用户自定义
管理工具
GPU服务器
格式
语义
数据库结构
数据库更新
字符
批量
材料特征
脚本
分析工具
自然语言
数值
系统为您推荐了相关专利信息
关键字
自然语言文本
大语言模型
序列标注模型
光学字符识别
电池容量预测方法
矢量特征
电化学阻抗谱
三元组
容量预测模型
历史负荷数据
变电站
大语言模型
人工智能算法
配电网网架结构
强化学习策略
水印嵌入方法
水印检测器
后处理模块
比特流