一种基于大语言模型实现的稠密编码器的处理方法和装置

AITNT
正文
推荐专利
一种基于大语言模型实现的稠密编码器的处理方法和装置
申请号:CN202510467306
申请日期:2025-04-15
公开号:CN120353916A
公开日期:2025-07-22
类型:发明专利
摘要
本发明实施例涉及一种基于大语言模型实现的稠密编码器的处理方法和装置,所述方法包括:选择一款已经完成预训练和NLP任务微调并基于纯解码器架构实现的大语言模型作为目标模型,并通过将目标模型解码器在推理过程中使用的因果掩膜矩阵固化为全1矩阵的改造方式得到双向编码器,并由目标模型的嵌入编码模块和多个双向编码器顺次连接组成稠密编码器;通过屏蔽词预测任务对稠密编码器进行一阶段微调,通过无监督对比学习机制对稠密编码器进行二阶段微调;微调结束后,利用稠密编码器为用户指定的目标文档库构建文档向量库,并基于文档向量库和稠密编码器为目标文档库提供检索服务。通过本发明的稠密编码器来处理文本检索任务能提高检索准确率。
技术关键词
编码器 分词 文本 大语言模型 掩膜矩阵 Softmax函数 序列 样本 优化器 解码器架构 编码模块 阶段 标签 词嵌入向量 无监督 加扰单元 注意力
系统为您推荐了相关专利信息
1
车辆扭矩分配方法、电子设备及车辆
扭矩分配策略 扭矩分配方法 样本 车辆运动数据 车轮
2
病理风险预测方法、装置、设备、存储介质和程序产品
预测图像数据 风险预测模型 风险预测方法 计算机程序产品 风险预测装置
3
一种意图识别方法、系统和相关装置
意图识别方法 模板 决策 语义 意图识别系统
4
敏感数据识别方法、装置、电子设备、介质及程序产品
敏感数据识别方法 分词 马尔可夫模型 矩阵 计算机程序产品
5
建筑施工方案的规范条文及说明信息智能引用系统及方法
内容识别系统 文档特征提取 机器学习算法 构建知识图谱 智能排版方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号