一种运营商领域的RAG文档拆分优化方法及系统

AITNT
正文
推荐专利
一种运营商领域的RAG文档拆分优化方法及系统
申请号:CN202510689267
申请日期:2025-05-27
公开号:CN120654656A
公开日期:2025-09-16
类型:发明专利
摘要
本发明公开了一种运营商领域的RAG文档拆分优化方法及系统,属于大模型优化技术领域,该方法的实现包括:上传文档,通过minio和paradeDB分别存储源文件和文件信息;构建文档加载器,根据文件类型自动选择对应的加载器进行文件处理,转化为统一的markdown文本,解析文档中的图片并转化为base64格式;构建图片处理器,将文本中的图片base64字符串提取出来,进行位图和矢量图的处理,转化为markdown的图片引用格式;构建文档分割器;向量转化;文本召回。本发明解决目前RAG中,图片提取转化、处理复杂的问题,一个数据库即可实现向量检索、全文检索、混合检索功能,减少了运维成本。
技术关键词
图片 文本 加载器 矢量图 命令行工具 表格 格式 机器可读程序 分割器 模型优化技术 生成文件名 字符串替换 处理器 计算机 模块 列表 字典 存储桶 文件夹 存储器
系统为您推荐了相关专利信息
1
一种电网系统故障的巡检方法及系统
视觉特征 查询特征 图像 故障类别 巡检方法
2
训练数据获取方法及系统、语音识别方法、设备及介质
训练数据获取方法 人声 语音识别训练 语音识别方法 语音识别模型
3
一种基于快递面单的信息识别方法
快递面单 信息识别方法 数字特征信息 快递盒 条形码特征
4
一种小样本下CLAHE的声纹网络识别方法、系统及存储介质
网络识别方法 样本 数据 神经网络模型 概率密度函数
5
一种基于隐私号码电话机器人外呼方法
外呼方法 号码 机器人 电话 提示音
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号