摘要
本申请涉及人工智能技术领域,提出一种AI大模型安全评测方法、装置、电子设备和计算机程序产品。该方法包括:获取由待测AI大模型基于风险问题文本输出的待测回复文本;从多个评测AI大模型中,选取与待测回复文本所属的第一风险维度适配的第一评测AI大模型;通过第一评测AI大模型对待测回复文本进行预测,输出待测回复文本的第一预测风险标签。该方法通过为不同风险维度的待测回复文本定向分配最适配的评测AI大模型,能够实现风险维度与模型能力的定向匹配,让在特定风险维度表现更优异的评测AI大模型专门处理对应风险维度的评测任务,最终实现了评测效率、评测准确率以及评测成本的兼顾。
技术关键词
文本
风险
评测方法
标签
计算机程序产品
数据
样本
电子设备
评测装置
机器学习模型
梯度下降法
人工智能技术
误差控制
网络
处理器
接口
存储器
模块
系统为您推荐了相关专利信息
时间序列预测模型
数据中心冷却系统
多层感知机层
矩阵
积层
储能系统
充放电模式
PWM占空比
电梯曳引机
充放电控制方法