一种引入稠密向量检索器的大语言模型的处理方法和装置

正文

推荐专利

申请号：CN202411486178

申请日期：2024-10-23

公开号：CN119398193B

公开日期：2025-09-26

类型：发明专利

摘要

本发明实施例涉及一种引入稠密向量检索器的大语言模型的处理方法和装置，所述方法包括：将一类大语言模型作为第一大语言模型；基于第一大语言模型在对应的定向NLP任务微调中使用的定向文本语料集初始化稠密向量数据库；在第一大语言模型中增加稠密向量检索器和特征融合模块构成第二大语言模型并对其进行训练；训练结束后由第二大语言模型以稠密向量数据库为参考来处理定向NLP任务；并定期更新稠密向量数据库，并定期基于最新的稠密向量数据库对第二大语言模型进行一次评估，并在当次评估不合格时对第二大语言模型进行一次微调。通过本发明既可以保证模型的时效性、又可以降低模型的维护成本、提高模型的经济价值。

技术关键词

大语言模型标签文本特征提取模块文本特征向量字段标识编码模块机器翻译优化器归一化相关系数编码向量输入端序列注意力数据更新分词模式

系统为您推荐了相关专利信息

一种数据比对方法、装置、计算机设备及存储介质

数据比对方法计算机可读指令校验规则异常数据业务校验

基于机器学习的肌电图步态识别评估方法及系统

人体肌电信号机器学习模型步态识别计算机可读指令人工神经网络模型

中医寒热虚实辨证的方法及系统

光电容积脉搏波信号心率面部人脸非线性特征

人体姿态的估计方法、装置、设备及存储介质

三维人体姿态估计估计方法融合特征多层感知器视频

基于数据增强和特征融合的音频指纹定位方法及装置

指纹定位方法特征提取网络室内音频定位方法注意力数据

一种引入稠密向量检索器的大语言模型的处理方法和装置

站点导航

APP 下载