摘要
本发明属于网络安全领域,公开了一种基于预训练模型的代码片段敏感认证信息检测方法,包括:定义敏感认证信息类别;爬取包含敏感认证信息的代码片段作为训练数据,对代码片段进行预处理和标注;构建基于CodeBERT预训练模型的模型架构,使用训练数据对模型进行训练,并保存模型;使用训练好的模型检测待测代码片段,提取敏感认证信息;对敏感认证信息进行过滤,输出敏感认证信息。本发明提出的一种基于预训练模型的代码片段敏感认证信息检测方法,弥补了敏感认证信息检测效率低下误报率高的缺陷,提高了检测的精确性和正确性,为敏感信息泄露的安全防御工作提供支撑。
技术关键词
信息检测方法
预训练模型
密码
条件随机场
标签
定义
网络结构
密钥
关键字
数据
序列
字符
符号
实体
算法
端口
基础