摘要
本发明公开了一种用于人工智能应用软件的测试方法、装置、设备及产品,包括向当前测试的人工智能应用软件输入测试问题,得到人工智能应用软件返回的第一回答;人工确定测试问题的第二回答;建立评判标准,评判标准用于评价第一回答的质量分数;利用大语言模型根据第二回答以及评判标准,对第一回答进行评价,生成第一回答对应的质量分数;如果质量分数大于设定阈值,则人工智能应用软件返回的第一回答通过测试。本发明公开了一种用于人工智能应用软件的测试方法、装置、设备及产品,可以利用大语言模型,实现对输出结果不确定的人工智能应用软件进行测试,具有测试效果好、应用范围广以及性能可靠的优点。
技术关键词
测试方法
大语言模型
检查点
处理器
控件
计算机程序产品
页面
模块
存储装置
可读存储介质
电子设备
服务器
逻辑
系统为您推荐了相关专利信息
流水线产品
计数方法
振幅传感器
传送机构
速度传感器
闭合轮廓
汽车零件模具
定位方法
数控设备
计算机程序指令