一种基于深度学习的RAG检索优化方法、系统及电子设备

正文

推荐专利

申请号：CN202411533194

申请日期：2024-10-31

公开号：CN119415625A

公开日期：2025-02-11

类型：发明专利

摘要

本发明公开了一种基于深度学习的RAG检索优化方法、系统及电子设备，包括将存储于不同场景的知识库中的各类文档进行预处理；将预处理后的文本块进行分词处理，获得文本块分词处理后的语料；获取待检索的用户问题，将用户问题和文档中的文本块进行向量化；将向量化后的文本块通过python Annoy框架近似搜索算法构建向量搜索库，得到问题向量的相似向量；利用TF‑IDF算法，基于文本块分词后的语料，提取出文本块的关键词；利用文本块的关键词和所述相似向量进行模型训练；基于训练好的TF‑IDF模型，抽取输入问题和文本块的关键词集合的相似度，分类召回目标知识库。上述方案利用深度学习实现知识库分类粗召回，可弥补采用以往的全量文本块召回导致的耗时长的缺陷。

技术关键词

文本分词语义分割算法数据抽取关键词场景编码器搜索算法样本可读存储介质模块处理器电子设备关系定义电子装置框架

系统为您推荐了相关专利信息

一种地面无人平台在越野机动条件下的运动控制仿真方法

地面无人平台误差模型运动控制模型仿真方法数据驱动模型

基于量子密钥的数据安全传输方法、装置、设备及介质

数据安全传输方法联邦学习模型中心服务器数据加密密钥解密

基于AI多源融合及视觉补偿的室外热舒适评价系统及方法

热舒适评价深度学习语义分割 XGBoost算法视觉街景

地图数据处理方法及装置

车道路段地图数据处理方法关系地图数据处理装置

基于深度学习的用户音色克隆与语音合成方法及装置

音色特征语音迁移学习技术深度学习算法非临时性计算机可读存储介质

一种基于深度学习的RAG检索优化方法、系统及电子设备

站点导航

APP 下载