摘要
本发明公开了一种基于多模态深度学习的离子液体润滑性能数据智能挖掘方法,首先,从在线数据库获取离子液体领域文献摘要和关键文段,构建领域语料库,并利用标注工具构建包含预定义实体类型的实体识别数据集和关系抽取数据集;其次,基于通用BERT模型和所建语料库,通过掩码语言模型等任务进行继续预训练,构建领域特定的预训练语言模型ILsBERT;随后,利用所述实体识别数据集微调ILsBERT,并采用一种Transformer(ILsBERT)+BiLSTM+CRF的混合架构进行命名实体识别,以获取增强语义向量表征并预测文本序列标签;接着,利用所述关系抽取数据集微调ILsBERT,通过关系分类模型挖掘实体间的语义关系,形成结构化的润滑性能数据组;最后,对提取的数据组进行标准化处理,存入结构化数据库,并提供数据导出、API接口及基于Web框架的可视化界面,支持交互式的数据检索、过滤、统计分析与展示。本发明通过领域预训练模型和特定下游任务架构,实现了对离子液体润滑文献的高效信息抽取、标准化存储与可视化分析。
技术关键词
离子液体
数据挖掘方法
标注工具
实体
文本
语义向量
BERT模型
可视化界面
润滑
关系
训练语言模型
词嵌入向量
序列
推理算法
多模态深度学习
上下文语义信息
双向长短期记忆
摘要
模糊匹配算法
系统为您推荐了相关专利信息
大语言模型
多模态
图谱
物料回收方法
编辑距离算法