摘要
本发明公开一种基于专利数据的技术领域本体构建方法,首先获取专利数据集,并进行预处理;然后,将IPC主分类号对应的部名、大类名和小类名分别与通用知识库中的实体进行链接,得到第一、二、三层候选技术概念集;对第一、二层候选技术概念进行人工筛选,使用GAT模型对第三层候选技术概念进行自动筛选,得到第一、二、三技术概念层,建立各层之间的层级关系,得到静态层;接着,基于专利名称构建动态层,包括第四、五、六技术概念层及其层级关系;最后,建立第三、四技术概念层之间的层级关系,实现静态层和动态层的集成,得到有向无环图结构,即技术领域本体。该方法能够自动从专利数据中提取技术概念,构建多层次的技术领域本体,提高了构建效率。
技术关键词
概念
有向无环图结构
层级
IPC分类号大类
节点
BiLSTM模型
DBSCAN算法
关系
词嵌入向量
生成标签
动态
数据格式
代表
聚类
字符
多层次
符号
系统为您推荐了相关专利信息
知识图谱问答方法
路径优化方法
生成图谱
大语言模型
门控循环单元
脊柱侧弯检测方法
神经网络模型
电信号
半导体光源
光电探测器
双层规划方法
负荷
储能设备
充放电功率
分层聚类算法