摘要
本申请公开了一种金融文本大模型性能评估方法及装置。该方案中,将目标评估样本库中的评估样本输入至目标模型,获取目标模型的输出结果及运行时性能数据。基于运行时性能数据对目标模型生成推理性能得分。基于输出结果对目标模型进行基础语义质量评估和领域专业性评估生成业务质量得分。根据目标模型的应用业务场景类型,为推理性能得分和业务质量得分分配权重比例。基于权重比例生成目标模型的性能总分。本申请技术方案针对金融领域的特殊需求,从包括领域专业性等多个维度对模型进行评估,全面反映金融文本大模型的性能。根据业务场景类型动态调整权重,使得评估结果更贴合实际业务需求。实现了对金融文本大模型性能的全面、精准评估。
技术关键词
生成业务
性能评估方法
文本
金融
合规性
性能评估装置
样本
逻辑
生成关键词
指标
场景
层次分析法
生成资源
数据获取模块
语义向量
模板
基础
系统为您推荐了相关专利信息
BERT模型
画像方法
企业画像
画像系统
多标签
推荐系统方法
大语言模型
多层感知机
跨模态
成分分析
强化学习模型
加密方法
交叉注意力机制
加密策略
节点
高分子新材料
性能检测数据
性能评估方法
检测表
高分子材料