基于RAG的多格式数据快速查询方法

AITNT
正文
推荐专利
基于RAG的多格式数据快速查询方法
申请号:CN202510031091
申请日期:2025-01-09
公开号:CN119415544A
公开日期:2025-02-11
类型:发明专利
摘要
本发明涉及数据管理与查询技术领域,公开了基于RAG的多格式数据快速查询方法,包括以下步骤:步骤a、用户通过前端界面上传目标文件,所述文件为PDF、Word或Excel格式的任意一种;步骤b、对所述上传的文件进行格式验证;步骤c、根据文件格式选择相应的解析工具,使用PyMuPDF、python‑docx或openpyxl库对所述文件进行文本及结构化数据提取;步骤d、将解析后的数据分别存储至PostgreSQL数据库和Faiss数据库。通过结合结构化数据存储与非结构化数据向量化存储的方式,利用Faiss进行高效的向量相似度检索,大大缩短了数据查询的响应时间。相较于传统的基于全文搜索的查询方法,本方法能够快速从大量数据中精确地返回与用户查询最相关的结果,从而提高了数据查询的效率。
技术关键词
数据快速查询方法 解析工具 结构化数据格式 语音输入方式 非结构化文本 BERT模型 自然语言 语音识别模块 全文搜索 指令 查询技术 数据管理 表格 数据存储 界面
系统为您推荐了相关专利信息
1
用于改进信息检索和生成质量的文本处理方法及装置、计算机系统
文本处理方法 信息检索 分块 计算机系统 语义
2
一种在案件中智能识别用户输入并查询文档模版的方法
智能识别用户 案件 预训练模型 嵌入式系统控制 计算机可存储介质
3
基于分层式复合奖励强化学习的大语言模型XPath生成方法
生成方法 层级 分层 大语言模型 列表
4
一种面向应急供水事件的知识图谱构建方法
知识图谱构建方法 非结构化文本 实体 人机交互方式 对象
5
文本与标识符联合生成方法、装置、设备及介质
预训练语言模型 生成方法 模块 指令 生成程序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号