摘要
本申请实施例公开了一种基于模型的数据处理方法、装置、设备及介质。该方法包括:获取训练样本,训练样本包括样本问题、针对样本问题拆分得到的具有逻辑顺序的多个问题,以及多个问题分别对应的标准答复;将训练样本输入到待训练语言模型中,通过待训练语言模型执行以下步骤:获取样本问题中含有的元素的嵌入向量;对嵌入向量进行噪声干扰处理,得到干扰嵌入向量;基于干扰嵌入向量生成多个问题分别对应的推理答复;基于多个问题分别对应的标准答复和推理答复,对待训练语言模型进行训练,得到语言模型,语言模型用于对待答复问题进行推理。本申请方案中语言模型的推理能力好,提升了推理的准确性、效率等,从而保证了基于模型的数据处理可靠性。
技术关键词
训练语言模型
数据处理方法
元素
样本
字符
注意力
逻辑
电子设备
数据处理装置
计算机程序产品
随机噪声
文本
处理器
介质
指令
数学
编程
模块
系统为您推荐了相关专利信息
音频编解码方法
神经网络模型
矢量量化
编码器
量化器
面向深度神经网络
公平性优化方法
神经网络模型
剪枝技术
神经网络剪枝
地球物理测井
数据处理方法
测井解释模型
岩心孔隙度
伽马测井