一种基于图嵌入的RAG文本分块方法

AITNT
正文
推荐专利
一种基于图嵌入的RAG文本分块方法
申请号:CN202510229488
申请日期:2025-02-28
公开号:CN120146009A
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种基于图嵌入的RAG文本分块方法,涉及文本处理技术领域,包括:基于各个句子的特征向量,获取句子间的特征相似度,建立句子间相似度矩阵;基于句子间相似度矩阵,构建句子关系图以及句子关系邻接矩阵;基于句子关系图,采用邻域聚合方式对节点进行更新,获取更新后的句子关系图;基于更新后的句子关系图,对于节点对应的句子进行组合,形成各个文本块,能够使得语义相似的句子分到同一个文本块,增加了文本分块的准确性,提高了RAG系统后续检索阶段的匹配精度以及大模型生成回答的质量。
技术关键词
文本分块方法 节点 关系 矩阵 元素 文本处理技术 字符 邻居 邻域 度函数 索引 语义 阶段 精度
系统为您推荐了相关专利信息
1
模型训练方法、装置、存储介质和电子设备
模型训练方法 网络结构 语音识别模型 节点 模型训练装置
2
一种数据分享方法及设备、存储介质
数据分享方法 蓝牙 消息 标识 处理器
3
超低渗油藏注水开发策略的调整优化方法、装置、设备及介质
超低渗油藏 超低渗致密油藏 液量 裂缝 遗传算法
4
一种基于SiC基底的智能温控加热平台及芯片加工方法
加热单元 三维温度场 智能温控 基底 矩阵
5
基于灰狼算法优化特征模态分解的滚动轴承故障诊断方法
滚动轴承故障诊断方法 灰狼算法 信息熵 重构 皮尔逊相关系数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号