一种面向RAG问答系统的文本分块语义连贯性检测方法

正文

推荐专利

申请号：CN202510726979

申请日期：2025-06-03

公开号：CN120632036A

公开日期：2025-09-12

类型：发明专利

摘要

本发明属于人工智能技术机器学习和语义理解领域，涉及语义分析和语义识别，是一种面向RAG问答系统的文本分块语义连贯性检测方法，具体通过对不同分块的语义损失进行量化，辅助拒绝采样构造监督微调（SFT）和强化学习（RL）训练集，进而提升大语言模型的文本分块能力，优化RAG系统的检索效果和答案生成质量。本发明通过量化分块内部的语义一致性和分块边界处的语义跳跃程度，为评估文本分块质量提供了客观依据，并设计实验验证了该算法的有效性，对提升大语言模型的文本分块能力、RAG问答系统的检索效果和答案生成质量具有重要意义。

技术关键词

分块问答系统语义文本大语言模型答案损失计算方法有效性人工智能技术块边界数据机制框架训练集样本服务器算法参数

系统为您推荐了相关专利信息

一种检索方法、装置及存储介质

检索装置摘要语义检索方法大语言模型

一种深海机器人驱动电机的多速率异步采样控制方法

采样控制方法深海机器人电枢分区参数

一种层次化精准识别的自动驾驶避障系统

语义分割网络街景标签驾驶避障图像处理模块

基于文本分类算法的诱导取消订单风控判责方法和装置

文本分类模型文本分类算法订单数据样本

一种支持高并发的实时交互数字人系统及其实现方法

优先级算法支持高并发无锁队列音视频同步误差

一种面向RAG问答系统的文本分块语义连贯性检测方法

站点导航

APP 下载