摘要
本发明公开了一种基于大模型的位置去偏的长期对话方法,包括以下步骤:1)对于输入的对话D,对大模型使用位置嵌入的注意力进行调整,提取对话中的因果相关话语;2)对大模型进行微调,将微调过程中的损失分为两部分:预测损失和因果感知损失;3)使用经过步骤1)和步骤2)调整后的大模型作为长期对话系统的基座,使用时,系统指令和对话历史D连接起来并输入模型用以生成回复R。本发明通过对大模型进行微调,使模型不再受到位置偏见的影响,使用上述微调后的大模型作为长期对话系统的基座用以生成回复,增强其因果感知能力,提高模型的性能。
技术关键词
对话方法
对话系统
注意力
处理器
基座
存储装置
语义
可读存储介质
指令
效应
风险
异性
电子设备
程序
聚类
计算机
偏差
元素
频率
数据
系统为您推荐了相关专利信息
表面肌电信号
识别方法
Sigmoid函数
时域特征
加速度
标志物
机械臂控制方法
机器人
连线
图像采集装置
车辆转向控制方法
车辆转向控制装置
多模态特征
场景
预测车辆轨迹
公交车定位方法
关键点
充电站
神经网络模型
视觉