摘要
本申请公开了一种基于大语言模型的合同文本脱敏方法、系统、设备、介质及产品,涉及数据处理领域,该方法包括将待脱敏合同文件转换为文本形式,得到待脱敏合同文本,利用第一设定正则表达式识别待脱敏合同文本中的固定格式隐私数据,利用命名实体识别模型识别待脱敏合同文本中的命名实体;所述命名实体识别模型是利用训练样本对大语言模型进行训练得到的;所述训练样本包括合同文本样本数据和对应的命名实体样本;利用随机数据对待脱敏合同文本中识别到的固定格式隐私数据和识别到的命名实体进行替换,得到脱敏后的合同文本。本申请能够提高合同文本的脱敏效率和准确率。
技术关键词
命名实体识别模型
大语言模型
脱敏方法
格式
数据
脱敏系统
样本
字符
处理器
文本
计算机程序产品
计算机设备
识别模块
可读存储介质
存储器
系统为您推荐了相关专利信息
汽车方向盘
喇叭按钮
耐久检测装置
材料疲劳参数
按压机构
联合估计方法
锂离子电池
多状态
梯度提升决策树
状态估计方法
关键控制参数
光伏逆变器
控制参数整定方法
无功电流
集群
剩余寿命预测方法
数据驱动模型
待测设备
频域特征
指标