一种基于仅解码器架构的文档向量搜索引擎的构建方法

AITNT
正文
推荐专利
一种基于仅解码器架构的文档向量搜索引擎的构建方法
申请号:CN202410892615
申请日期:2024-07-04
公开号:CN118689994B
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开一种基于仅解码器架构的文档向量搜索引擎的构建方法,涉及文档搜索引擎技术领域,所述方法包括:基于大语言模型构建企业文档检索训练数据;以仅解码器架构大模型构建嵌入向量生成器;使用企业文档检索训练数据对仅解码架构的嵌入向量生成器进行训练与调优;使用训练好的仅解码架构的嵌入向量生成器计算企业文档的嵌入向量并保存在向量数据库中;基于向量数据库搭建搜索引擎后台。本发明以先进的仅解码器架构大模型作为基座,并利用大语言模型构造训练数据,针对性训练一个专门针对企业文档内容的搜索引擎,允许用户从企业文档库中快速查找并定位所需的企业文档库,提高企业员工的工作效率。
技术关键词
解码器架构 解码架构 子模块 企业 大语言模型 文档管理系统 数据 文档搜索引擎 格式化 存储模块 页面 在线 编码 员工 基座 参数
系统为您推荐了相关专利信息
1
一种用于java业务流程循环次数预警方法
预警方法 预警机制 企业资源计划系统 重试机制 参数
2
基于人工智能的起重机识别系统
子系统 三维环境信息 中央控制 环境监测模块 规划
3
一种基于智能体模拟的电力系统负荷预测方法及系统
电力系统负荷预测 大语言模型 蒙特卡洛方法 决策 偏好特征
4
模型训练方法、装置、设备、存储介质和产品
大语言模型 文本 多模态 模型训练方法 答案
5
一种卫浴装修方案智能生成方法与装置
智能生成方法 室内空间 关键词提取模型 客户 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号