摘要
本发明公开了一种基于图嵌入的RAG文本分块方法,涉及文本处理技术领域,包括:基于各个句子的特征向量,获取句子间的特征相似度,建立句子间相似度矩阵;基于句子间相似度矩阵,构建句子关系图以及句子关系邻接矩阵;基于句子关系图,采用邻域聚合方式对节点进行更新,获取更新后的句子关系图;基于更新后的句子关系图,对于节点对应的句子进行组合,形成各个文本块,能够使得语义相似的句子分到同一个文本块,增加了文本分块的准确性,提高了RAG系统后续检索阶段的匹配精度以及大模型生成回答的质量。
技术关键词
文本分块方法
节点
关系
矩阵
元素
文本处理技术
字符
邻居
邻域
度函数
索引
语义
阶段
精度
系统为您推荐了相关专利信息
模型训练方法
网络结构
语音识别模型
节点
模型训练装置
滚动轴承故障诊断方法
灰狼算法
信息熵
重构
皮尔逊相关系数