一种大语言模型多轮对话上下文保持能力的量化评估系统及方法

正文

推荐专利

申请号：CN202510859942

申请日期：2025-06-25

公开号：CN120803920A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开一种大语言模型多轮对话上下文保持能力的量化评估系统及方法，涉及自然语言处理评估技术领域。针对LLM在多轮对话能力评测中存在的标准缺失和主观依赖问题，采用方案包括：动态场景生成模块，基于规则模板和LLM协同生成含标记信息点的多轮对话流；干扰注入模块，在对话流中插入可控干扰；三层评估模块，以带干扰对话流作为输入，通过记忆精度层、关联深度层和干扰抗性层量化LLM的基础记忆衰退、话题逻辑关联度和抗干扰鲁棒性，计算信息衰减率、衰减指数和抗干扰系数；衰减率分析模块，基于计算结果对应生成曲线，直观呈现LLM的性能变化趋势；可视化报告模块，整合前述输出生成交互式评估报告。本发明用于LLM上下文理解能力的客观评测。

技术关键词

大语言模型多轮对话量化评估系统正确率量化评估方法动态场景记忆话题分析模块语义曲线指数鲁棒性阶段逻辑纵轴横轴报告文本

系统为您推荐了相关专利信息

一种基于AI学生的教育预测大模型的建构方法

建构方法个性化学习路径学生蒙特卡洛树动态数据集

一种内容筛选方法、装置、电子设备、介质及产品

内容筛选方法大语言模型文本感兴趣节点

一种软件测试中基于大模型生成测试用例的方法及装置

生成测试用例大语言模型生成技术机器可读程序自然语言

一种基于融合了大模型和知识图谱的知识库服务方法及系统

数据访问权限企业知识图谱查询意图大语言模型自然语言

基于胶囊内窥镜的医学报告自动生成方法及系统

胶囊内窥镜关键帧报告自动生成方法文本视觉特征

一种大语言模型多轮对话上下文保持能力的量化评估系统及方法

站点导航

APP 下载