摘要
本发明提供了一种基于字词多粒度特征增强算法的施工规范文本知识图谱构建方法,在命名实体识别任务中,引入BERT预训练语言模型作为嵌入层,获取字粒度与词粒度向量表示,在解决了一词多义问题的同时提高专业词在句中重要性,将其与BiLSTM‑Attention‑CRF模型融合,构建工程规范实体识别模型;在关系抽取任务中,采用BiLSTM‑Attention构建工程规范关系抽取模型。结合工程规范知识图谱,通过基于知识图谱的全局信息展示、特定信息检索,提升工程规范知识的利用效率,辅助工程现场施工。本发明将工程施工规范管理、文本处理技术与深度学习方法特点相结合,实现了施工规范文本的深度分析,提高安全管理信息的挖掘效率,构建了工程规范知识图谱,为工程领域智能化管控提供了重要支撑。
技术关键词
知识图谱构建方法
多粒度特征
文本
Attention机制
字词
工程现场施工
实体识别模型
混合深度学习
训练语言模型
BERT模型
命名实体识别
规范特征
Softmax分类器
信息检索
算法
字符
三元组
系统为您推荐了相关专利信息
多模态特征选择
邮件分类方法
拉丁超立方采样
聚类
级联
语义
指标查询方法
生成训练样本
训练样本集
实体
知识库构建方法
大语言模型
语义检索方式
文本
数据