摘要
本发明公开了基于自然语言处理的合同风险条款识别方法,该方法首先从合同数据集中提取条款集合,其中每条条款即一个样本数据。其次对每个样本数据中的文本进行统一预处理,生成句子级向量。然后基于句子级向量中的每个句子向量,构造正负样本对。以后采用对比学习方法对正负样本对的集合进行学习,并构建分类器输出条款识别结果。本发明显著提升对合同文本中复杂句式的语义理解能力,并提升模型对语义相似但类别不同的条款的区分能力。
技术关键词
自然语言
识别方法
样本
构建分类器
学习方法
风险
大语言模型
多层感知机
数据
注意力
文本
标签
语义
优化器
超参数
术语
度量
字符
系统为您推荐了相关专利信息
广告评估方法
画像
自然语言模型
实时数据
生成广告
音频
计算机终端设备
数据处理模块
数据标签
模型训练模块
分割识别方法
脑胶质瘤
组学特征
图像解码器
影像
识别茶叶嫩芽
检测识别方法
茶叶品种
深度强化学习
图像
支持向量机分类算法
自动识别方法
短时傅里叶变换
生成地震波
传感器