一种针对非结构化文档的知识库构建方法、系统及一种大模型问答方法、系统

AITNT
正文
推荐专利
一种针对非结构化文档的知识库构建方法、系统及一种大模型问答方法、系统
申请号:CN202411901322
申请日期:2024-12-23
公开号:CN119831009A
公开日期:2025-04-15
类型:发明专利
摘要
本发明公开了一种针对非结构化文档的知识库构建方法、系统及一种大模型问答方法、系统。该方法获取非结构化文档,划分文档区域;解析所述文档区域得到非结构化文档信息;利用启发式规则处理所述非结构化文档信息,得到初始文本;校对并修改所述初始文本,得到最终文本;向量化所述最终文本,得到最终文本向量;将对应的最终文本向量与最终文本作为知识库条目,保存为数据库。该方法可以简单高效地处理非结构化文档并构建知识库,进而提升大语言模型问答系统的准确性。
技术关键词
非结构化文档 知识库构建方法 启发式规则 文本 问答方法 条目 生成答案 问答系统 模块 大语言模型 构建系统 间距 数据 坐标
系统为您推荐了相关专利信息
1
基于外部知识库的长文本关系确定方法、装置及电子设备
实体 文本 编码 BERT模型 标记
2
质谱仪用户查询系统及质谱仪设备
数字孪生系统 查询系统 质谱仪设备 输入模块 文本
3
一种基于数据治理和数据价值提取的数据管理方法及系统
数据管理方法 数据治理系统 数据采集策略 深度学习方法 数据资源优化
4
基于大语言模型的地质条件工程风险辅助分析方法及系统
辅助分析方法 大语言模型 风险 图谱 地质勘探资料
5
虚拟道具的处理方法、装置、设备、存储介质及程序产品
资源 显示虚拟对象 计算机可执行指令 元素 计算机程序产品
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号