摘要
本发明公开一种基于仅解码器架构的文档向量搜索引擎的构建方法,涉及文档搜索引擎技术领域,所述方法包括:基于大语言模型构建企业文档检索训练数据;以仅解码器架构大模型构建嵌入向量生成器;使用企业文档检索训练数据对仅解码架构的嵌入向量生成器进行训练与调优;使用训练好的仅解码架构的嵌入向量生成器计算企业文档的嵌入向量并保存在向量数据库中;基于向量数据库搭建搜索引擎后台。本发明以先进的仅解码器架构大模型作为基座,并利用大语言模型构造训练数据,针对性训练一个专门针对企业文档内容的搜索引擎,允许用户从企业文档库中快速查找并定位所需的企业文档库,提高企业员工的工作效率。
技术关键词
解码器架构
解码架构
子模块
企业
大语言模型
文档管理系统
数据
文档搜索引擎
格式化
存储模块
页面
在线
编码
员工
基座
参数
系统为您推荐了相关专利信息
预警方法
预警机制
企业资源计划系统
重试机制
参数
子系统
三维环境信息
中央控制
环境监测模块
规划
电力系统负荷预测
大语言模型
蒙特卡洛方法
决策
偏好特征
智能生成方法
室内空间
关键词提取模型
客户
文本