摘要
本发明提供了大模型驱动的树索引结构在RAG内容解析中的应用方法,所述方法根据原始文本的长度和预设文本长度获取初始文本;根据初始文本对应的中间文本列表,获取中间文本列表对应的树状存储数据,其中,中间文本包括中间段落文本和中间段落文本对应的中间标题路径,中间标题路径中包括若干个标题级别不同的标题文本;获取树状存储数据中的每一个节点对应的属性信息,并将节点对应的属性信息存储到节点中,以使得对树状存储数据进行更新并给树状存储数据分配一个唯一的ID;将树状存储数据和树状存储数据的ID上传到RAG对应的数据库中,能够保证文本的整体结构和初始文本之间的语义联系不被破坏,能够提高RAG的检索效率和生成质量。
技术关键词
节点
列表
数据
关键词
字符
文本主题分类模型
中文文本
索引
生成规则
标签
语义
分词
数值
算法
系统为您推荐了相关专利信息
软测量方法
工业控制系统
时间序列分析技术
风机
压力
人机界面
图像识别模块
数据采集模块
语音识别模块
模拟鼠标
节点
盾构管片
RFID标签
RFID读写设备
检索标签
语义分割模型
计算机执行指令
状态监测方法
像素
状态监测装置