摘要
本公开涉及一种推荐系统评测方法、装置、设备及介质。本公开在推荐系统根据访问请求生成推荐内容的过程中,对所述过程包括的多个处理动作中每个处理动作的处理对象数据和处理结果进行记录,得到该访问请求对应的多个记录信息。进一步,根据该访问请求对应的多个记录信息生成大语言模型的输入信息,并将所述输入信息输入大语言模型。该大语言模型输出该推荐系统在多个评测指标上的评测值。进一步,根据该推荐系统在多个评测指标上的评测值,确定该推荐系统的评测结果。实现了对推荐系统的自动化评测,降低了评测成本,另外,通过大语言模型对推荐系统进行评测具有一定的客观性,提高了评测结果的准确性。
技术关键词
推荐系统
大语言模型
生成推荐内容
指标
评测方法
文本
评测装置
数据
处理器
输入模块
对象
可读存储介质
存储器
场景
电子设备
基础
计算机