摘要
本申请公开了一种对话模型训练方法、装置、设备及介质,涉及人工智能技术领域,包括:通过记忆模块并基于动态权重策略调整预设记忆库中的各当前记忆单元的重要性权重,按照重要性权重的大小顺序过滤低权重的记忆单元,以更新预设记忆库,获取当前预设记忆库;当预训练模型接收到用户发起的训练请求,输出满足相似度条件的若干目标相似度计算结果;将与各目标相似度计算结果对应的记忆单元作为目标记忆单元,对各目标记忆单元以及查询向量进行加权聚合,以训练记忆模块基于各目标记忆单元与查询向量输出对应的聚合记忆信息,并将聚合记忆信息输入至预训练模型,以便预训练模型根据聚合记忆信息与查询向量生成与查询请求对应的响应信息。
技术关键词
记忆单元
预训练模型
模型训练方法
交叉注意力机制
权重策略
模块
模型训练装置
动态
超参数
存储计算机程序
人工智能技术
可读存储介质
处理器
标记
电子设备
主题
字符
通知
系统为您推荐了相关专利信息
阿尔茨海默病
磁共振成像数据
预测模型训练方法
深度学习模型
分割图像数据
模型训练方法
动作识别方法
参数
终端设备
环境感知数据
分层混合模型
文本处理模型
图像处理模型
融合特征
交叉注意力机制
电池寿命预测方法
数据
预训练模型
验证算法
样本