一种基于分支式拼接的低成本检索增强生成评测方法

正文

推荐专利

申请号：CN202411025815

申请日期：2024-07-30

公开号：CN118966198A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种基于分支式拼接的低成本检索增强生成评测方法，涉及自然语言处理的检索增强生成技术领域，将训练数据进行“检索问题+输出答案”、“检索问题+检索结果列表”、“检索结果列表+输出答案”的重新分组，用于分别判断语言大模型的答案相关性、上下文相关性和忠实性，针对答案相关性，利用词袋模型和TF‑IDF模型，计算Jaccard相似度、余弦相似度等多种指标；针对忠实性，计算MRR、MSR等指标；针对上下文相关性，使用了基于Textrank的文本处理方法，最终对每一项指标进行综合考量，直到达到预定目标。这种方法不仅提高了评测的全面性和可靠性，也有效降低了评测过程中的主观性和偶然性，使得评测结果更加客观、可信。

技术关键词

答案评测方法列表词袋模型低成本分支指标词语关键词信息检索系统文本处理方法分词数据矩阵机器学习算法评测系统生成技术精度

系统为您推荐了相关专利信息

融合知识图谱的客户服务智能路由方法

融合知识图谱关键词字符文本构建知识图谱

一种使用知识图谱检索增强大模型的焊接工艺参数推荐方法

焊接工艺参数实体三元组知识图谱构建词向量模型

增强多模态大模型的细粒度感知能力的方法、基于多模态大模型的图像处理方法及装置

视觉特征编码模块大语言模型多模态检测损失

基于LangGraph工作流的知识图谱自动化构建系统和方法

自动化构建系统实体维基百科关系多源异构数据

一种基于大语言模型与检索增强的学科试题生成方法和装置

大语言模型试题生成方法知识点解析器文本

一种基于分支式拼接的低成本检索增强生成评测方法

站点导航

APP 下载