基于大模型的嵌入模型的训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202410865861

申请日期：2024-06-28

公开号：CN118917372A

公开日期：2024-11-08

类型：发明专利

摘要

本申请涉及自然语言处理技术领域，尤其涉及一种基于大模型的嵌入模型的训练方法、装置、设备及介质。将特定领域的样本文本输入到初始嵌入模型的编码器中进行编码，该编码器中包括多个编码子层，在编码器进行编码时，获取编码器中每个编码子层输出的第一特征向量，并根据每个编码子层对应的权重和第一特征向量，确定该样本文本的预测特征向量，由于该预测特征向量是融合不同编码子层的第一特征向量所确定的，因此该预测特征向量是融合了不用层次的语义特征的，提高了编码的准确率，并根据该预测特征向量和样本文本的标准特征向量确定第一损失值，根据该第一损失值训练初始嵌入模型得到的嵌入模型在编码时具备更高的准确率。

技术关键词

文本编码器样本解码器训练集语义特征训练装置电子设备编码模块自然语言处理器可读存储介质存储器计算机

系统为您推荐了相关专利信息

一种基于多个视频图像屏的拼接装置

拼接装置拼接控制器 LCD拼接屏半圆形万能解码器

一种基于自提示引导的动态决策图像分割方法

图像分割方法提示器分离器模块图像编码器决策

基于身体指标监测的健康管理方案生成方法和装置

身体生成方法指标坐标机器学习算法

一种水下弱信号到达时间预测方法、模型训练方法及模型

信号到达时间信号特征提取序列神经网络模型数据

一种定量-判别一体化尿毒症智能检测系统

智能检测系统血清连续小波变换样本偏最小二乘法

基于大模型的嵌入模型的训练方法、装置、设备及介质

站点导航

APP 下载