基于大语言模型的合同文本脱敏方法、系统、设备、介质及产品

AITNT
正文
推荐专利
基于大语言模型的合同文本脱敏方法、系统、设备、介质及产品
申请号:CN202411050608
申请日期:2024-08-01
公开号:CN118940314A
公开日期:2024-11-12
类型:发明专利
摘要
本申请公开了一种基于大语言模型的合同文本脱敏方法、系统、设备、介质及产品,涉及数据处理领域,该方法包括将待脱敏合同文件转换为文本形式,得到待脱敏合同文本,利用第一设定正则表达式识别待脱敏合同文本中的固定格式隐私数据,利用命名实体识别模型识别待脱敏合同文本中的命名实体;所述命名实体识别模型是利用训练样本对大语言模型进行训练得到的;所述训练样本包括合同文本样本数据和对应的命名实体样本;利用随机数据对待脱敏合同文本中识别到的固定格式隐私数据和识别到的命名实体进行替换,得到脱敏后的合同文本。本申请能够提高合同文本的脱敏效率和准确率。
技术关键词
命名实体识别模型 大语言模型 脱敏方法 格式 数据 脱敏系统 样本 字符 处理器 文本 计算机程序产品 计算机设备 识别模块 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种汽车方向盘喇叭按钮按压耐久检测装置及其检测方法
汽车方向盘 喇叭按钮 耐久检测装置 材料疲劳参数 按压机构
2
一种基于电化学模型与机器学习的锂离子电池多状态联合估计方法
联合估计方法 锂离子电池 多状态 梯度提升决策树 状态估计方法
3
一种提升光伏集群电压故障穿越性能的控制参数整定方法
关键控制参数 光伏逆变器 控制参数整定方法 无功电流 集群
4
一种基于混合数据驱动模型的机器剩余寿命预测方法、系统及设备
剩余寿命预测方法 数据驱动模型 待测设备 频域特征 指标
5
一种转炉平台的安全监测方法及装置
转炉平台 监测方法 图像 工况识别技术 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号