基于大模型的嵌入模型的训练方法、装置、设备及介质

AITNT
正文
推荐专利
基于大模型的嵌入模型的训练方法、装置、设备及介质
申请号:CN202410865861
申请日期:2024-06-28
公开号:CN118917372A
公开日期:2024-11-08
类型:发明专利
摘要
本申请涉及自然语言处理技术领域,尤其涉及一种基于大模型的嵌入模型的训练方法、装置、设备及介质。将特定领域的样本文本输入到初始嵌入模型的编码器中进行编码,该编码器中包括多个编码子层,在编码器进行编码时,获取编码器中每个编码子层输出的第一特征向量,并根据每个编码子层对应的权重和第一特征向量,确定该样本文本的预测特征向量,由于该预测特征向量是融合不同编码子层的第一特征向量所确定的,因此该预测特征向量是融合了不用层次的语义特征的,提高了编码的准确率,并根据该预测特征向量和样本文本的标准特征向量确定第一损失值,根据该第一损失值训练初始嵌入模型得到的嵌入模型在编码时具备更高的准确率。
技术关键词
文本 编码器 样本 解码器 训练集 语义特征 训练装置 电子设备 编码模块 自然语言 处理器 可读存储介质 存储器 计算机
系统为您推荐了相关专利信息
1
一种基于多个视频图像屏的拼接装置
拼接装置 拼接控制器 LCD拼接屏 半圆形 万能解码器
2
一种基于自提示引导的动态决策图像分割方法
图像分割方法 提示器 分离器模块 图像编码器 决策
3
基于身体指标监测的健康管理方案生成方法和装置
身体 生成方法 指标 坐标 机器学习算法
4
一种水下弱信号到达时间预测方法、模型训练方法及模型
信号到达时间 信号特征提取 序列 神经网络模型 数据
5
一种定量-判别一体化尿毒症智能检测系统
智能检测系统 血清 连续小波变换 样本 偏最小二乘法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号