摘要
本发明公开了一种基于科学文献的合金结构化信息获取方法,旨在实现高效准确地从海量文献中提取合金等相关化学材料实验数据,有效解决了识别生物化学相关专业术语,提取化学成分与材料性能之间的关联的难题。本发明通过自然语言处理技术的文本挖掘方法。通过MatSciBERT模型,从文献中准确识别化学元素、合金成分及其相关术语,并提取化学成分与材料性能之间的关联。该方法包括文献下载、数据预处理、句子分类、命名实体识别和关系抽取等步骤,生成结构化数据库,并利用这些数据建立机器学习模型,预测合金性能。本发明有效实现了基于数据驱动的材料设计,节省实验资源和成本,具有重要的实际应用价值。
技术关键词
合金
命名实体识别
信息获取方法
机器学习模型
文本挖掘方法
文章
实体关系抽取
数据获取方法
表格
自然语言
期刊
表头
术语
手工
编码
标记
序列
系统为您推荐了相关专利信息
环境监测方法
动力设备
数据采集频率
数据采集模块
绝缘保护装置
金属引线框架
防护芯片
封装结构
导线
印刷电路板面积