摘要
本申请涉及一种基于多任务深度学习的双边关系知识库构建方法和装置。所述方法过将构建国家双边关系知识库的四个子任务共享一个多任务深度学习模型,实现在同一模型中联合学习四项任务,从而能够同时对新闻文本进行实体抽取、摘要生成、新闻分类与情感分析,输出包括双边国家、时间、新闻摘要、新闻类型、情感类型在内的完整信息,最终高效构建一个覆盖国家双边关系多个层面的大规模双边关系知识库。采用本方法有效解决了现有双边关系知识库构建中各个子任务独立训练、缺乏协同优化和数据标注及模型部署成本高等问题,实现了新闻文本理解和国家双边关系数据库的高效构建,具有显著的技术优势和应用价值。
技术关键词
摘要
实体
多任务深度学习
知识库构建方法
训练语言模型
训练集
自然语言
编码
多头注意力机制
分类器
标记
条件随机场
文本理解
模型训练模块
验证算法
数据采集模块