摘要
本发明公开了一种卫星文档表格数据检索方法、装置、设备及介质,所述方法通过获取卫星文档中的表格信息,对表格信息进行向量化处理,以获得表征表格信息的嵌入向量,将用户提问问题与表格信息的嵌入向量进行对比分析,以筛选出与用户提问问题相匹配的表格数据,将筛选出的表格数据作为检索结果反馈至用户。所述方法根据文档XML格式解码其中的表格内容,递归的构建JSON格式化结构。利用表头信息、表体信息及上下文文档资料信息,使用大语言模型的Prompts技术进行核心信息凝练及高维度向量化数值压缩。此外,针对表格JSON格式化后tokens可能超过大语言模型上限的问题,采用迭代信息整合法,渐进式的对表格信息进行凝练及汇总,从而保证了检索内容的精确性。
技术关键词
表格
数据检索方法
大语言模型
JSON结构
表头
表体
数据检索装置
格式化
信息处理模块
电子设备
计算机
自然语言
匹配模块
处理器
输出模块
存储装置
可读存储介质
程序
系统为您推荐了相关专利信息
智能问诊系统
大语言模型
梅尔频率倒谱系数
模拟程序
深度学习模型
文本检测方法
大语言模型
语义
查询重构
判别特征