摘要
本发明提供一种基于自然语言处理和深度学习算法的知识抽取方法,在获取某地区耕地的监测成果数据的基础上,采用斯坦福七步法构建耕地“非粮化”监测成果知识本体模型;进而以深度学习模型作为核心,采用Pipeline技术实施所述知识抽取任务,提取包含实体、关系与实体间的连接信息的三元组结构,完成耕地“非粮化”监测成果非结构化数据的知识抽取。该方法结合了双向长短期记忆网络模型和预训练语言模型RoBERTa的优势,并加入了条件随机场CRF,能准确高效地提取耕地“非粮化”领域包含实体、关系与实体间的连接信息的三元组。
技术关键词
知识抽取方法
深度学习算法
自然语言
知识本体
耕地
双向长短期记忆网络
CRF模型
实体
条件随机场
调查监测方法
深度学习模型
关系
三元组
训练语言模型
BERT模型
序列
网络架构
行政区
计算方法
概念
系统为您推荐了相关专利信息
语义信息处理
政务服务系统
多模态数据采集
信息输入设备
语义向量
关键词提取模型
语义分析模型
自然语言
词语
文本
新能源汽车核心
数据交互方法
数据适配模块
数据采集模块
智能算法
状态识别方法
浮选泡沫
模糊逻辑算法
面积检测方法
模糊集合