一种基于大语言模型的材料科研文本数据提取方法

正文

推荐专利

申请号：CN202510809536

申请日期：2025-06-17

公开号：CN120654671B

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及材料数据管理领域，具体为一种基于大语言模型的材料科研文本数据提取方法和设备。所述方法包括根据材料科研文本得到目标数据集；构建分类模型并利用标准二分类交叉熵损失函数对其进行微调，通过微调后的模型得到待提取数据集；构建表头提取模型并利用交叉熵损失函数对所述表头提取模型进行微调，通过微调后的模型得到表头数据集，再将表头数据集与预设的表头模版组合，构成自适应表头模板；根据自适应表头模板，从材料科研文本信息中提取结构化数据，再对所述结构化数据进行校验，得到校验后的结构化数据。以此方式，可以全面提升系统在不同类型材料科研文本中的适应性、完整性、准确性与智能化水平。

技术关键词

表头文本数据提取科研文本校正异常数据构建分类模型大语言模型样本屈服序列字典索引标记强度术语模板处理器

系统为您推荐了相关专利信息

一种基于机器学习的风电机组故障预警方法

离线风电机组故障预警数据预处理方法填补算法模型预测值

一种基于模拟数据支持的口腔诊断系统

诊断系统矫正模拟模型缝隙图像增强单元

银行业务数据的质量分析处理方法、装置以及电子设备

银行业务数据神经网络模型计算机执行指令语义特征提取逻辑

一种用于智能手机主板的测试方法及测试系统

智能手机主板智能分析模型测试方法手机主板功能手机主板测试

可变负载消磁电源测试方法及系统

消磁电源人工神经网络模型测试方法实时数据参数随时间

一种基于大语言模型的材料科研文本数据提取方法

站点导航

APP 下载