摘要
本发明涉及软件技术领域,具体涉及一种基于多维度的司法大模型效果评价方法、程序产品。包括以下步骤:获取大模型的生成结果以及对应的参考答案;从词语维度、语句维度、强化学习与人类反馈维度计算生成结果与参考答案之间的相似度,然后对这三者数值进行归一化操作,再加权求和,得到最终评价得分。本发明从多个维度,对大模型的生成效果做出评价,通过使用本评价,有利于在大模型训练过程中,得到更好的训练效果。
技术关键词
评价方法
自然语言
词语
深度学习模型
语句
计算机程序产品
人类
数值
数据
处理器
编码
指标