摘要
本发明涉及材料数据管理领域,具体为一种基于大语言模型的材料科研文本数据提取方法和设备。所述方法包括根据材料科研文本得到目标数据集;构建分类模型并利用标准二分类交叉熵损失函数对其进行微调,通过微调后的模型得到待提取数据集;构建表头提取模型并利用交叉熵损失函数对所述表头提取模型进行微调,通过微调后的模型得到表头数据集,再将表头数据集与预设的表头模版组合,构成自适应表头模板;根据自适应表头模板,从材料科研文本信息中提取结构化数据,再对所述结构化数据进行校验,得到校验后的结构化数据。以此方式,可以全面提升系统在不同类型材料科研文本中的适应性、完整性、准确性与智能化水平。
技术关键词
表头
文本数据提取
科研
文本校正
异常数据
构建分类模型
大语言模型
样本
屈服
序列
字典
索引
标记
强度
术语
模板
处理器
系统为您推荐了相关专利信息
离线
风电机组故障预警
数据预处理方法
填补算法
模型预测值
银行业务数据
神经网络模型
计算机执行指令
语义特征提取
逻辑
智能手机主板
智能分析模型
测试方法
手机主板功能
手机主板测试
消磁电源
人工神经网络模型
测试方法
实时数据
参数随时间