摘要
本申请实施例公开一种基于大模型的敏感信息检测方法、电子设备和存储介质,包括:获取定制数据集,所述定制数据集包括第一数据集和第二数据集;使用监督微调的方法利用所述第一数据集来训练并调整原始大模型的内部参数,获取训练后的大模型;将所述第二数据集输入至所述训练后的大模型进行敏感词检测,获取检测错误的数据用于构建直接偏好优化训练数据集;对所述原始大模型同时使用不同的数据集进行直接偏好优化训练和监督微调训练,从而使训练完成的大模型能够针对输入来进行判别,输出是否为敏感信息以及具体的敏感信息类别。
技术关键词
优化训练数据
敏感信息检测方法
多轮对话
状态自动机
检测错误
大语言模型
单轮
白名单机制
电子设备
字段
处理器通信
算法
聚类
存储器
定义
指令
参数
格式
系统为您推荐了相关专利信息
建立关联关系
情感分析模型
意图识别模型
智能对话系统
工具组件
辅助显示区域
案件
笔录生成方法
智能终端界面
生成装置