基于大模型的位置去偏的长期对话方法

AITNT
正文
推荐专利
基于大模型的位置去偏的长期对话方法
申请号:CN202410925347
申请日期:2024-07-11
公开号:CN118798338A
公开日期:2024-10-18
类型:发明专利
摘要
本发明公开了一种基于大模型的位置去偏的长期对话方法,包括以下步骤:1)对于输入的对话D,对大模型使用位置嵌入的注意力进行调整,提取对话中的因果相关话语;2)对大模型进行微调,将微调过程中的损失分为两部分:预测损失和因果感知损失;3)使用经过步骤1)和步骤2)调整后的大模型作为长期对话系统的基座,使用时,系统指令和对话历史D连接起来并输入模型用以生成回复R。本发明通过对大模型进行微调,使模型不再受到位置偏见的影响,使用上述微调后的大模型作为长期对话系统的基座用以生成回复,增强其因果感知能力,提高模型的性能。
技术关键词
对话方法 对话系统 注意力 处理器 基座 存储装置 语义 可读存储介质 指令 效应 风险 异性 电子设备 程序 聚类 计算机 偏差 元素 频率 数据
系统为您推荐了相关专利信息
1
基于AWPSO-SVM模型的sEMG识别方法、电子设备及存储介质
表面肌电信号 识别方法 Sigmoid函数 时域特征 加速度
2
机器人的机械臂控制方法、电子设备及存储介质
标志物 机械臂控制方法 机器人 连线 图像采集装置
3
一种车辆转向控制方法及装置、电子设备、存储介质
车辆转向控制方法 车辆转向控制装置 多模态特征 场景 预测车辆轨迹
4
一种老年失能人群动态体位调整护理方法
护理方法 生理 动态 Apriori算法 策略
5
一种基于视觉的电动公交车定位模型、系统及相关装置
公交车定位方法 关键点 充电站 神经网络模型 视觉
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号