基于大模型的敏感信息检测方法、电子设备和存储介质

正文

推荐专利

申请号：CN202510510296

申请日期：2025-04-22

公开号：CN120407809A

公开日期：2025-08-01

类型：发明专利

摘要

本申请实施例公开一种基于大模型的敏感信息检测方法、电子设备和存储介质，包括：获取定制数据集，所述定制数据集包括第一数据集和第二数据集；使用监督微调的方法利用所述第一数据集来训练并调整原始大模型的内部参数，获取训练后的大模型；将所述第二数据集输入至所述训练后的大模型进行敏感词检测，获取检测错误的数据用于构建直接偏好优化训练数据集；对所述原始大模型同时使用不同的数据集进行直接偏好优化训练和监督微调训练，从而使训练完成的大模型能够针对输入来进行判别，输出是否为敏感信息以及具体的敏感信息类别。

技术关键词

优化训练数据敏感信息检测方法多轮对话状态自动机检测错误大语言模型单轮白名单机制电子设备字段处理器通信算法聚类存储器定义指令参数格式

系统为您推荐了相关专利信息

一种面向流调全过程的智能辅助流调方法

集群人工智能模型个性化特征移动端对象

一种基于用户反馈的短信内容AI迭代方法及系统

迭代方法短信主题序列多轮对话

智能对话系统、方法、设备及介质

建立关联关系情感分析模型意图识别模型智能对话系统工具组件

智能问答界面的显示方法、装置、存储介质及计算机设备

界面智能问答机器人页面样式意图阶段

基于大模型的笔录的生成方法、生成装置及计算机产品

辅助显示区域案件笔录生成方法智能终端界面生成装置

基于大模型的敏感信息检测方法、电子设备和存储介质

站点导航

APP 下载