摘要
本发明公开了一种基于分支式拼接的低成本检索增强生成评测方法,涉及自然语言处理的检索增强生成技术领域,将训练数据进行“检索问题+输出答案”、“检索问题+检索结果列表”、“检索结果列表+输出答案”的重新分组,用于分别判断语言大模型的答案相关性、上下文相关性和忠实性,针对答案相关性,利用词袋模型和TF‑IDF模型,计算Jaccard相似度、余弦相似度等多种指标;针对忠实性,计算MRR、MSR等指标;针对上下文相关性,使用了基于Textrank的文本处理方法,最终对每一项指标进行综合考量,直到达到预定目标。这种方法不仅提高了评测的全面性和可靠性,也有效降低了评测过程中的主观性和偶然性,使得评测结果更加客观、可信。
技术关键词
答案
评测方法
列表
词袋模型
低成本
分支
指标
词语
关键词
信息检索系统
文本处理方法
分词
数据
矩阵
机器学习算法
评测系统
生成技术
精度
系统为您推荐了相关专利信息
焊接工艺参数
实体
三元组
知识图谱构建
词向量模型
自动化构建系统
实体
维基百科
关系
多源异构数据