一种模型安全性评估方法、装置、存储介质及设备

正文

推荐专利

申请号：CN202411919093

申请日期：2024-12-24

公开号：CN119760726A

公开日期：2025-04-04

类型：发明专利

摘要

本申请提供了一种模型安全性评估方法、装置、存储介质及设备，该方法应用于计算机技术领域，该方法包括：向大语言模型输入非安全行为数据，获取大语言模型针对非安全行为数据的目标响应内容。基于相似性度量函数对目标响应内容与预设响应模版进行相似度匹配，若匹配失败，则获取非安全行为数据对应的目标评估规则，将目标评估规则、非安全行为数据以及目标响应内容添加至目标提示词中，基于目标提示词对大语言模型进行安全评估。通过非安全行为数据获取到大语言模型的目标响应内容，以对目标响应内容进行一系列自动检测，进而实现对大语言模型的安全评估，降低了人工成本，提升了大语言模型的可靠性和安全性。

技术关键词

相似性度量函数大语言模型安全性评估方法模版输入输出接口计算机存储介质数据编辑语义存储程序代码因子处理器评估装置存储器计算机设备风险文本指令页面

系统为您推荐了相关专利信息

芯片辅助开发方法、装置、存储介质及设备

开发方法模版芯片参数辅助开发装置

基于大语言模型的医学知识图谱构建方法、系统、终端及存储介质

实体医学知识图谱三元组关键词大语言模型

一种基于人工智能的供应链金融风险控制系统

风险智能评价模型资金控制系统人工智能评价

一种基于大语言模型的工业资产关联分析方法及系统

工业资产关联业务流程数据业务流程信息大语言模型分析方法

一种数据库索引生成方法、装置、设备、介质和程序产品

大语言模型索引生成方法生成特征向量索引生成装置监控日志

一种模型安全性评估方法、装置、存储介质及设备

站点导航

APP 下载