摘要
本申请公开了一种数据识别方法、装置、电子设备、存储介质及程序产品,涉及数据安全技术领域,包括:获取待识别数据、待识别数据所属行业的各敏感类型以及每一所述敏感类型的主题词汇,其中敏感类型的主题词汇基于敏感类型的行业样本数据确定;将行业的各敏感类型、每一敏感类型的主题词汇以及待识别数据输入至预设大语言模型,通过预设大语言模型依据各敏感类型的主题词汇确定待识别数据分别与各敏感类型的相关性;将相关性大于预设相关阈值的敏感类型作为待识别数据的目标敏感类型。本申请通过预设大语言模型的语义理解能力,实现了对待识别数据的敏感类型识别,提高了数据的敏感类型识别准确性,解决了数据的敏感类型识别准确度低的技术问题。
技术关键词
数据识别方法
大语言模型
主题
双曲正切函数
样本
分词
关键词提取算法
计算机程序产品
数据识别装置
电子设备
数据安全技术
可读存储介质
温控
处理器通信
存储器
参数
系统为您推荐了相关专利信息
X射线荧光光谱
光谱重叠峰分解方法
高斯混合模型
粒子群优化算法
参数
植被分类方法
随机森林
高分辨率遥感数据
样本
mRMR算法
数据融合方法
RBF神经网络
样本
均匀取样方法
精度