一种多维度大模型测试评价方法及系统

AITNT
正文
推荐专利
一种多维度大模型测试评价方法及系统
申请号:CN202511062330
申请日期:2025-07-31
公开号:CN120561929B
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种多维度大模型测试评价方法及系统,属于人工智能测试技术领域,融合基础模型、平台能力与应用性能实现多维度大模型测试评价,包括:基础模型能力评价,包括敏感词库+BERT语义双引擎安全检测和上下文依赖测试链;模型平台能力评价,包括预置LLM智能标注和双人背靠背数据回流;应用性能评价,包括字符扰动鲁棒性测试和LIME可解释性分级评估;通过RESTful异构模型纳管接口实现大模型全栈测试,基于GPU衰减率量化实现国产化兼容性适配验证。本发明解决现有技术对平台工程化能力、安全合规性及国产化支持的评价缺失问题,实现三维能力耦合评测,解决国产化适配难题,填补大模型全栈测试技术空白。
技术关键词
测试评价方法 语义 文本 机器可读程序 人工智能测试 测试评价装置 测试评价系统 鲁棒性 分布式训练 平台 双人 字符 分类准确率 置信度阈值 多轮对话 基础 风险 计算机 数据 异构
系统为您推荐了相关专利信息
1
基于深度学习的全冠修复预备体边缘线提取方法及系统
三维网格分割 三维网格数据 线提取方法 三角网格数据 平滑边缘
2
一种多语言文字转录方法及系统
语音特征数据 高维特征向量 AR设备 动作特征 视觉特征
3
一种基于图像识别的药品数量输送监管方法
监管方法 药盒 多模态信息融合 深度学习算法 语义
4
基于蓝牙音频SoC的智能闹钟控制方法、智能蓝牙耳机和存储介质
智能闹钟控制方法 音乐播放参数 智能蓝牙耳机 闹铃 音频
5
对话模型训练方法、医疗随访对话方法和装置
模型训练方法 矩阵 注意力 对话方法 多轮对话
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号