一种面向RAG问答系统的文本分块语义连贯性检测方法

AITNT
正文
推荐专利
一种面向RAG问答系统的文本分块语义连贯性检测方法
申请号:CN202510726979
申请日期:2025-06-03
公开号:CN120632036A
公开日期:2025-09-12
类型:发明专利
摘要
本发明属于人工智能技术机器学习和语义理解领域,涉及语义分析和语义识别,是一种面向RAG问答系统的文本分块语义连贯性检测方法,具体通过对不同分块的语义损失进行量化,辅助拒绝采样构造监督微调(SFT)和强化学习(RL)训练集,进而提升大语言模型的文本分块能力,优化RAG系统的检索效果和答案生成质量。本发明通过量化分块内部的语义一致性和分块边界处的语义跳跃程度,为评估文本分块质量提供了客观依据,并设计实验验证了该算法的有效性,对提升大语言模型的文本分块能力、RAG问答系统的检索效果和答案生成质量具有重要意义。
技术关键词
分块 问答系统 语义 文本 大语言模型 答案 损失计算方法 有效性 人工智能技术 块边界 数据 机制 框架 训练集 样本 服务器 算法 参数
系统为您推荐了相关专利信息
1
一种检索方法、装置及存储介质
检索装置 摘要 语义 检索方法 大语言模型
2
一种深海机器人驱动电机的多速率异步采样控制方法
采样控制方法 深海机器人 电枢 分区 参数
3
一种层次化精准识别的自动驾驶避障系统
语义分割网络 街景 标签 驾驶避障 图像处理模块
4
基于文本分类算法的诱导取消订单风控判责方法和装置
文本分类模型 文本分类算法 订单 数据 样本
5
一种支持高并发的实时交互数字人系统及其实现方法
优先级算法 支持高并发 无锁队列 音视频 同步误差
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号