摘要
本发明公开了一种面向长文档的实体关系抽取方法,涉及机器学习技术领域,方法包括构建提示模板,将输入文档与预训练语言模型加入的特殊标识符进行拼接,构成新文档;在预训练语言模型中嵌入类型注意力和结构注意力,得到长文档编码预训练语言模型;将新文档输入长文档编码预训练语言模型,得到实体关系预测结果。本发明一方面通过提示信息与嵌入注意力,通过增强输入和编码器能力来提升对文档的理解效果,另一方面通过提示模板结合实体与关系的关联性,构建了一个融合实体、指代和关系的完整联合抽取框架。本发明方法有效解决了现有技术中存在的长文档语义复杂、实体间存在长距离依赖的问题以及实体与关系的抽取中存在的错误传播问题。
技术关键词
实体关系抽取方法
预训练语言模型
注意力
标识符
实体关系抽取系统
三元组
模板
机器学习技术
可读存储介质
表达式
分类器
存储器
计算机
处理器
编码器
电子设备
系统为您推荐了相关专利信息
数字化管理系统
客户
数字化管理方法
蒙特卡洛树搜索
意图
智能问答方法
多模态
注意力机制
文本编码器
词典
蓝牙音箱
智能手机
交互方法
特征提取模块
视频通话模式