摘要
本发明提供一种合同文本的结构化处理方法、装置、设备及存储介质,该方法包括:对合同文本进行预处理,生成标准化词语序列,标准化词语序列包括多个词语序列和各词语序列的词性标注信息;将标准化词语序列输入命名实体识别模型识别得到合同文本中的关键实体,并基于机器学习算法提取合同文本中的关键条款,关键实体包括合同双方、合同金额和产品名称,关键条款包括付款条款、交货条款、违约责任条款及不可抗力条款;通过依存句法分析与语义角色标注模型,解析得到关键实体及关键条款间的语义关系;将提取的关键实体、关键条款以及语义关系以结构化形式存储至目标数据库,并建立目标索引以支持快速查询。本发明减少了人工处理的出错率。
技术关键词
词语
命名实体识别模型
语义角色标注
依存句法分析
序列
机器学习算法
双向长短期记忆网络
索引
非暂态计算机可读存储介质
语法结构
语义特征
关系型数据库
标签
分词算法
处理器
系统为您推荐了相关专利信息
前馈神经网络
注意力机制
解码器
位置编码单元
编码器
图像识别算法
图像分析
监测方法
图像识别模型
数据
平滑控制方法
同步电机
马达
系统状态信息
序列二次规划算法