摘要
本发明涉及数据处理技术领域,公开了一种基于向量数据库和大模型的数据处理系统及方法,其中系统包括:内容向量化模块,用于将文档内容转化为内容向量;向量数据库模块,用于构建索引获得索引向量数据库;知识提取模块,用于将问题向量与索引向量数据库中最相关内容向量对应的文档内容通过大模型进行优化作为决策支持结果输出;相关推荐模块,将问题向量与索引向量数据库之间的向量相似度高于相似度最低阈值的内容向量对应的文档内容作为相关结果输出。本发明实现了PPT文件的自动化知识提取与高效检索,还能通过语义理解生成专业的答案,并附加相关文档链,降低用户获取所需信息的时间成本,提升了企业内部文档的利用率。
技术关键词
数据处理系统
索引
自然语言
模块
词嵌入模型
决策
数据处理方法
数据处理技术
语义向量
算法
文本
列表
答案
音频
专业
视频
企业
图像
系统为您推荐了相关专利信息
角膜
相机拍摄系统
眼压仪
测量方法
瞳孔识别方法
熔炼炉
故障安全模块
超高温陶瓷
高温传感器
智能温控系统
典型工装
工装设计方法
工艺平台
关键尺寸参数
全新设计
集成管理平台
建筑信息模型
数据集成方法
数据集成系统
节点