摘要
本发明公开了一种基于SND的大模型聊天幻觉减轻方法,获取聊天句子样本作为大模型的输入,大模型基于神经网络架构,包括输入层、隐藏层和输出层,所述隐藏层共有N层;在隐藏层的第N‑1层,将其前一层在前向传播过程中形成的激活矩阵转换为句子嵌入向量;提取所述句子嵌入向量中的嵌入元,通过差值计算得到相邻嵌入元之间的激活变化量,表示为检查点;计算各嵌入元的激活值在各个检查点之间的变异性,将变异性从大到小排列,并将排名靠前的一个或几个嵌入元丢弃;使用丢弃嵌入元之后的模型进行聊天。本发明可以从模型内部根本性地减少幻觉现象,使机器聊天对话过程更加更加准确、可靠,并增强与用户的交互信任。
技术关键词
检查点
神经网络架构
矩阵
样本
定义
系统为您推荐了相关专利信息
等效控制方法
关节
驱动绳索
PID控制器
机械臂基座
车辆运动学模型
横向位置误差
协方差矩阵
连续时间系统
卡尔曼滤波
神经网络架构搜索
面部表情识别方法
高性能网络结构
面部表情识别模型
渐进式方法
数字孪生模型
降阶方法
仿真数据
降阶模型
Simulink模型
检测牲畜
图像检测模型
纹理特征
区域生成网络
灰度共生矩阵