摘要
本申请涉及自然语言处理技术领域,尤其涉及一种基于大模型的嵌入模型的训练方法、装置、设备及介质。将特定领域的样本文本输入到初始嵌入模型的编码器中进行编码,该编码器中包括多个编码子层,在编码器进行编码时,获取编码器中每个编码子层输出的第一特征向量,并根据每个编码子层对应的权重和第一特征向量,确定该样本文本的预测特征向量,由于该预测特征向量是融合不同编码子层的第一特征向量所确定的,因此该预测特征向量是融合了不用层次的语义特征的,提高了编码的准确率,并根据该预测特征向量和样本文本的标准特征向量确定第一损失值,根据该第一损失值训练初始嵌入模型得到的嵌入模型在编码时具备更高的准确率。
技术关键词
文本
编码器
样本
解码器
训练集
语义特征
训练装置
电子设备
编码模块
自然语言
处理器
可读存储介质
存储器
计算机
系统为您推荐了相关专利信息
拼接装置
拼接控制器
LCD拼接屏
半圆形
万能解码器
图像分割方法
提示器
分离器模块
图像编码器
决策
信号到达时间
信号特征提取
序列
神经网络模型
数据
智能检测系统
血清
连续小波变换
样本
偏最小二乘法