基于加权投票的大语言模型全流程内容风险检测方法和装置

正文

推荐专利

申请号：CN202411869362

申请日期：2024-12-18

公开号：CN120068876A

公开日期：2025-05-30

类型：发明专利

摘要

本发明公开了一种基于加权投票的大语言模型全流程内容风险检测方法和装置，包括：在输入端对用户输入进行基于意图分析、有害关键词匹配、有害性检测提示词、注入攻击检测器的内容风险检测，对输入端各项内容风险检测的结果进行加权投票以确定用户输入是否安全，对于不安全的用户输入则拒绝回答；在大语言模型中对于安全的用户输入进行推理得到模型输出；在输出端对模型输出进行基于意图分析、有害性检测提示词、反向翻译的内容风险检测，对输出端各项内容风险检测的结果进行加权投票以确定模型输出是否安全，对于不安全的模型输出则拒绝输出，将安全的模型输出反馈至用户。本发明能对大语言模型推理流程中的风险内容进行高效、全面、准确的检测。

技术关键词

风险检测方法大语言模型关键词意图识别输入端输出端检测器攻击检测模型风险检测装置存储计算机程序标签模块处理器索引存储器电子设备

系统为您推荐了相关专利信息

基于景点图片生成景点视频的方法、系统、设备以及产品

图片关键词计算机可读指令场景文本

一种基于自然语言交互的AI视频实时编辑系统

编辑系统自然语言视频字幕物体运动轨迹

一种多模态大语言模型的课程思政语料库的构建方法

大语言模型深度学习模型模态特征网络爬虫技术数据

一种基于驾驶风格的换道意图识别方法

意图识别方法动态贝叶斯网络模型驾驶模拟器路段交通流滑动时间窗口

一种同步整流控制驱动电路以及开关电源

隔离传输电路同步整流控制同步整流开关逻辑控制电路副边同步整流

基于加权投票的大语言模型全流程内容风险检测方法和装置

站点导航

APP 下载