AI大模型安全评测方法、装置、电子设备和程序产品

正文

推荐专利

申请号：CN202511336717

申请日期：2025-09-18

公开号：CN120832676A

公开日期：2025-10-24

类型：发明专利

摘要

本申请涉及人工智能技术领域，提出一种AI大模型安全评测方法、装置、电子设备和计算机程序产品。该方法包括：获取由待测AI大模型基于风险问题文本输出的待测回复文本；从多个评测AI大模型中，选取与待测回复文本所属的第一风险维度适配的第一评测AI大模型；通过第一评测AI大模型对待测回复文本进行预测，输出待测回复文本的第一预测风险标签。该方法通过为不同风险维度的待测回复文本定向分配最适配的评测AI大模型，能够实现风险维度与模型能力的定向匹配，让在特定风险维度表现更优异的评测AI大模型专门处理对应风险维度的评测任务，最终实现了评测效率、评测准确率以及评测成本的兼顾。

技术关键词

文本风险评测方法标签计算机程序产品数据样本电子设备评测装置机器学习模型梯度下降法人工智能技术误差控制网络处理器接口存储器模块

系统为您推荐了相关专利信息

表示目标对象的表面轮廓以及控制机械臂

轮廓对象三维模型采样点多边形网格模型

一种提升大模型病历生成准确性的方法及装置

病历语音识别服务摘要客户端文本

数据中心冷却系统回水温度的预测方法及装置

时间序列预测模型数据中心冷却系统多层感知机层矩阵积层

用于电梯储能系统的充放电控制方法、设备、介质及产品

储能系统充放电模式 PWM占空比电梯曳引机充放电控制方法

一种基于SAAs的集成传感和反向散射通信方法

集成传感通信方法电压天线散射通信系统

AI大模型安全评测方法、装置、电子设备和程序产品

站点导航

APP 下载