一种基于大语言模型的材料科研文本数据提取方法

AITNT
正文
推荐专利
一种基于大语言模型的材料科研文本数据提取方法
申请号:CN202510809536
申请日期:2025-06-17
公开号:CN120654671B
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及材料数据管理领域,具体为一种基于大语言模型的材料科研文本数据提取方法和设备。所述方法包括根据材料科研文本得到目标数据集;构建分类模型并利用标准二分类交叉熵损失函数对其进行微调,通过微调后的模型得到待提取数据集;构建表头提取模型并利用交叉熵损失函数对所述表头提取模型进行微调,通过微调后的模型得到表头数据集,再将表头数据集与预设的表头模版组合,构成自适应表头模板;根据自适应表头模板,从材料科研文本信息中提取结构化数据,再对所述结构化数据进行校验,得到校验后的结构化数据。以此方式,可以全面提升系统在不同类型材料科研文本中的适应性、完整性、准确性与智能化水平。
技术关键词
表头 文本数据提取 科研 文本校正 异常数据 构建分类模型 大语言模型 样本 屈服 序列 字典 索引 标记 强度 术语 模板 处理器
系统为您推荐了相关专利信息
1
一种基于机器学习的风电机组故障预警方法
离线 风电机组故障预警 数据预处理方法 填补算法 模型预测值
2
一种基于模拟数据支持的口腔诊断系统
诊断系统 矫正 模拟模型 缝隙 图像增强单元
3
银行业务数据的质量分析处理方法、装置以及电子设备
银行业务数据 神经网络模型 计算机执行指令 语义特征提取 逻辑
4
一种用于智能手机主板的测试方法及测试系统
智能手机主板 智能分析模型 测试方法 手机主板功能 手机主板测试
5
可变负载消磁电源测试方法及系统
消磁电源 人工神经网络模型 测试方法 实时数据 参数随时间
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号