模型训练方法及敏感信息的识别方法

正文

推荐专利

模型训练方法及敏感信息的识别方法

申请号：CN202510686774

申请日期：2025-05-26

公开号：CN120561590A

公开日期：2025-08-29

类型：发明专利

摘要

本申请公开了一种模型训练方法及敏感信息的识别方法。其中，该模型训练包括：获取数据集，并在数据集中对相同主题的数据进行聚类，得到多个第一数据子集；确定第一敏感词的词汇多样性指标和上下文依赖性指标；根据每个第一数据子集中的第一敏感词的词汇多样性指标和上下文依赖性指标，确定每个第一数据子集对应的复杂度指标；确定每个第一数据子集对应的目标比例，并在每个第一数据子集中选取目标比例的训练数据，得到多个第二数据子集；分别采用数据集和不同的第二数据子集对敏感信息识别模型进行训练。本申请解决了由于相关技术未训练用于识别不同主题的敏感词的模型，造成的对不同主题的敏感词的识别精度较差的技术问题。

技术关键词

敏感信息识别模型训练方法指标数据非易失性存储介质复杂度识别方法语义向量文本预训练语言模型主题长短期记忆网络模型训练装置计算机程序产品聚类处理器模块批量频率

系统为您推荐了相关专利信息

一种基于通信中间件的多协议数据包解析重组方法及装置

有效载荷数据中间件协议转换模块标识符关键字

面向区域覆盖的SAR多星成像任务规划方法及系统

成像规划系统模块全局优化算法数据

一种汽车注塑内饰件的变形检测系统及方法

变形检测方法变形检测系统单层点云数据处理设备

一种物料仓储中心运输路径规划系统

运输路径规划系统预计行驶时间运输车辆拥堵指数交通流量信息

一种网络性能优化方法、装置、电子设备和存储介质

无线网络设备网络优化网络性能优化方法无线智能管理服务器

模型训练方法及敏感信息的识别方法

站点导航

APP 下载