一种基于本地大语言模型材料数据抽取与数据库构建方法

AITNT
正文
推荐专利
一种基于本地大语言模型材料数据抽取与数据库构建方法
申请号:CN202511048844
申请日期:2025-07-29
公开号:CN120877994A
公开日期:2025-10-31
类型:发明专利
摘要
一种基于本地大语言模型材料数据抽取与数据库构建方法,它涉及材料数据抽取和数据库构建方法。它是要解决现有的文献分析工具从科学文献中自动提取的数据有限、提取能力弱、文献适配性差的技术问题。本方法:首先,对收集的论文进行文本格式转换,并对转换后的文本进行文本清理;其次,调用本地部署大语言模型接口,构建提示工程;随后,进行正则抽取,提取以“材料‑属性‑数值”为格式的结构化三元组;最后,汇总数据存入MySQL数据库。本方法能够显著缩短数据库建立时间,减少人工整理成本,可高通量进行催化剂筛选,可用于材料的智能设计与研发领域。
技术关键词
数据库构建方法 三元组 大语言模型 电催化析氢材料 文本 支持用户自定义 管理工具 GPU服务器 格式 语义 数据库结构 数据库更新 字符 批量 材料特征 脚本 分析工具 自然语言 数值
系统为您推荐了相关专利信息
1
一种大语言模型处理系统及会话处理方法
节点 调度器 硬件加速器 内存 多轮会话
2
基于AI、RPA和AI Agent的文档处理方法、装置和设备
关键字 自然语言文本 大语言模型 序列标注模型 光学字符识别
3
动力电池容量预测方法、计算机设备及可读存储介质
电池容量预测方法 矢量特征 电化学阻抗谱 三元组 容量预测模型
4
基于人工智能算法的城市扩张区域变电站布局方法和系统
历史负荷数据 变电站 大语言模型 人工智能算法 配电网网架结构
5
基于强化学习策略模型的可控文本水印嵌入方法
强化学习策略 水印嵌入方法 水印检测器 后处理模块 比特流
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号