大语言模型的评估数据集的构建方法、装置、计算机设备和可读存储介质

AITNT
正文
推荐专利
大语言模型的评估数据集的构建方法、装置、计算机设备和可读存储介质
申请号:CN202510815123
申请日期:2025-06-18
公开号:CN120705527A
公开日期:2025-09-26
类型:发明专利
摘要
本申请涉及一种大语言模型的评估数据集的构建方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:获取不同评估维度对应的对话状态主题语句;对对话状态主题语句进行扩展,得到扩展后的对话状态主题语句;对扩展后的对话状态主题语句进行优化,得到待分析语句;待分析语句的对话状态信息的丰富度高于扩展后的对话状态主题语句的对话状态信息的丰富度;将待分析语句和对应的对话状态分析结果集作为评估数据集;对话状态分析结果集包括正确分析结果,以及与正确分析结果不同的至少一个分析结果;评估数据集用于对预训练的大语言模型的对话状态感知能力进行评估。采用本方法能够更加准确地评估大语言模型的对话状态感知能力。
技术关键词
语句 主题 大语言模型 标签 训练样本集 计算机设备 计算机程序产品 数据 可读存储介质 多轮对话 处理器 扩展模块 场景 存储器 定义 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号