摘要
本发明提供一种大语言模型生成稳定性评估方法、计算机设备及存储介质。本发明通过润色对原始问题进行扩充,得到一个更全面的测试集,再通过设置不同的temperature和top‑k的超参来生成答案,得到一个全面的评估的答案。然后,通过使用向量化计算聚集度的方式,保证了评估的语义泛化性,通过聚集度公式得到了评估的稳定性结果,通过置信度指标得到了稳定性结果的置信度。可在比现有技术更广泛的范围内真正提高和评价大语言模型的生成稳定性。
技术关键词
稳定性评估方法
生成答案
大语言模型
样本
数据
计算机设备
笛卡尔
处理器
可读存储介质
参数
矩阵
元素
存储器
代表
语义
编码
指标
分子
系统为您推荐了相关专利信息
网络优化策略
灰色关联分析方法
电气
无功补偿装置容量
电网结构优化
核酸检测装置
核酸扩增
微流控芯片
数据分析模块
温度控制模块
客户端
蒸馏
服务器
数据
非暂态计算机可读存储介质