摘要
本发明涉及自然语言处理与生成式对话技术领域,且公开了一种基于向量检索与大语言模型的文档编写系统,包括:数据采集与预处理模块、向量嵌入与存储模块、用户交互与Query扩展模块、相似度检索与筛选模块和并行处理与写作模块。该基于向量检索与大语言模型的文档编写系统及方法,预先下载并自动摘要不少于10万篇论文至本地数据库,使用M3E LARGE模型进行文本向量化,并将结果存储于Milvus或FAISS向量数据库中,确保了数据安全与隐私保护;相比传统在线检索模式,本地部署的大语言模型不仅避免了网络波动和数据泄露的风险,还提升了相似度检索的准确度和效率;用户交互与Query扩展模块通过挖掘同义词及学科延展方向进行Query扩展,进一步优化了检索质量。
技术关键词
编写系统
扩展模块
写作框架
大语言模型
摘要
存储模块
格式
文档型数据库
文本
负载均衡策略
同义词
条目
扩展单元
封装单元
索引
数据安全
论文
自然语言
系统为您推荐了相关专利信息
调度优化模型
船闸
船舶调度优化方法
群粒子群优化
学习方法
面部图像数据
患者
承载设备
视频设备
头部支撑装置
疾病诊断方法
消化道疾病诊断装置
样本
大语言模型
损失函数优化