摘要
本发明公开了面向总结性内容优化的大模型私有知识库及检索处理方法及系统,属于人工智能及数据处理技术领域,本发明要解决的技术问题为如何提高知识管理和检索的效率与准确性,进而提升对总结性内容的回答质量,采用的技术方案为:文档上传处理:用户上传文档后,调用内置大模型,运用深度优化的主题模型提取核心主题,同时借助格式转换工具将文档格式转为markdown格式,并提取文档目录结构,将主题、目录、文件名及markdown文档内容结构化存储至数据库与向量库;知识检索:构建优化倒序索引,依主题、目录及名称匹配筛选文档,再利用经参数优化训练的语义匹配算法进行文档片段匹配。
技术关键词
语义匹配算法
目录
训练语言模型
文档内容结构化
主题模型
文档型数据库
格式
关系型数据库
字段
分布式缓存技术
生成答案
句法分析技术
夹角余弦
倒排索引技术
文档关键词
核心
建立映射关系
系统为您推荐了相关专利信息
信息智能采集方法
海洋观测设备
设备运行状态
哈希表
观测台站
网络安全数据
关键词
拓扑图
评估系统
预训练语言模型
多模态技术
多模态数据采集
生成方法
预训练语言模型
文本