摘要
本申请公开了一种模型训练方法、模型幻觉的处理方法、设备、介质及产品,涉及计算机技术领域。方法包括:将三元组数据输入至文本语言模型,获得文本语言模型被三元组数据刺激时目标模块对三元组数据的样本内部表示;采用幻觉处理模型中空间编码模块,对样本内部表示进行不同空间映射,得到真实空间下的样本真实潜在表示和语义空间下的样本语义潜在表示;基于样本真实潜在表示和样本语义潜在表示,采用解码模块对目标模块的内部表示进行重建,得到样本重建内部表示;基于样本重建内部表示、样本内部表示、样本真实潜在表示和样本语义潜在表示中的至少部分,确定目标损失;基于目标损失,对幻觉处理模型的参数进行调整,得到训练好的幻觉处理模型。
技术关键词
样本
模型训练方法
语义
编辑
编码模块
前馈神经网络
解码模块
文本
三元组
注意力
计算机设备
处理器
可读存储介质
计算机程序产品
数据
令牌
重构
存储器
系统为您推荐了相关专利信息
动态场景SLAM方法
环视相机
视觉里程计
IMM算法
特征点
海洋物联网
入侵检测方法
云端服务器
异常流量
智能感知终端
二氧化碳制甲醇
协同调度方法
精馏塔
制取装置
响应面模型