一种基于大语言模型实现的稠密编码器的处理方法和装置

正文

推荐专利

申请号：CN202510467306

申请日期：2025-04-15

公开号：CN120353916A

公开日期：2025-07-22

类型：发明专利

摘要

本发明实施例涉及一种基于大语言模型实现的稠密编码器的处理方法和装置，所述方法包括：选择一款已经完成预训练和NLP任务微调并基于纯解码器架构实现的大语言模型作为目标模型，并通过将目标模型解码器在推理过程中使用的因果掩膜矩阵固化为全1矩阵的改造方式得到双向编码器，并由目标模型的嵌入编码模块和多个双向编码器顺次连接组成稠密编码器；通过屏蔽词预测任务对稠密编码器进行一阶段微调，通过无监督对比学习机制对稠密编码器进行二阶段微调；微调结束后，利用稠密编码器为用户指定的目标文档库构建文档向量库，并基于文档向量库和稠密编码器为目标文档库提供检索服务。通过本发明的稠密编码器来处理文本检索任务能提高检索准确率。

技术关键词

编码器分词文本大语言模型掩膜矩阵 Softmax函数序列样本优化器解码器架构编码模块阶段标签词嵌入向量无监督加扰单元注意力

系统为您推荐了相关专利信息

车辆扭矩分配方法、电子设备及车辆

扭矩分配策略扭矩分配方法样本车辆运动数据车轮

病理风险预测方法、装置、设备、存储介质和程序产品

预测图像数据风险预测模型风险预测方法计算机程序产品风险预测装置

一种意图识别方法、系统和相关装置

意图识别方法模板决策语义意图识别系统

敏感数据识别方法、装置、电子设备、介质及程序产品

敏感数据识别方法分词马尔可夫模型矩阵计算机程序产品

建筑施工方案的规范条文及说明信息智能引用系统及方法

内容识别系统文档特征提取机器学习算法构建知识图谱智能排版方法

一种基于大语言模型实现的稠密编码器的处理方法和装置

站点导航

APP 下载