轨道交通领域的RAG数据解析方法、装置、设备、介质

AITNT
正文
推荐专利
轨道交通领域的RAG数据解析方法、装置、设备、介质
申请号:CN202411806291
申请日期:2024-12-10
公开号:CN119692336A
公开日期:2025-03-25
类型:发明专利
摘要
本申请提供一种轨道交通领域的RAG数据解析方法、装置、设备、介质,该方法,包括:获取文档;若文档的格式非pdf格式,则将其转换为pdf格式;对pdf格式的文档进行版面分析,识别表格区域和文本区域;对于表格区域形成表格元素的html字符串;对于文本区域提取文本内容;将html字符串和文本内容转换为结构化的元数据,并存储于RAG的向量数据库中。本方法先将文档的格式统一为pdf格式,为数据解析提供统一的输入源,避免格式差异对解析结果的影响。再对文档的pdf格式进行版面分析,识别表格区域和文本区域,进而针对表格区域和文本区域分别提取元数据,实现了信息的完整、准确提取,提升了文档在实际工作中的应用价值。
技术关键词
表格 数据解析方法 格式 坐标 元素 中文文本 数据解析装置 文本检测模型 文本识别模型 处理器 识别模块 存储模块 可读存储介质 存储器 电子设备 列表
系统为您推荐了相关专利信息
1
一种客服问答处理方法及装置
客服 实体 格式化信息 生成关系 大语言模型
2
一种用于水润滑导轴承运行状态的仿真计算方法
水润滑导轴承 仿真计算方法 固体 轴瓦材料 三维模型
3
一种基于混合提示学习的交通事故伤残等级鉴定方法
文本 序列化方法 策略 模版 解码器
4
一种基于滤波的扫描辐射源跟踪方法
跟踪方法 协方差矩阵 预测误差 脉冲 滤波
5
一种基于AI算法的地质数据分析方法
数据分析方法 AI算法 NLP技术 数据建模方法 地质数据分析技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号