一种对话模型训练方法、装置、设备及介质

正文

推荐专利

一种对话模型训练方法、装置、设备及介质

申请号：CN202510121645

申请日期：2025-01-26

公开号：CN119578558A

公开日期：2025-03-07

类型：发明专利

摘要

本申请公开了一种对话模型训练方法、装置、设备及介质，涉及人工智能技术领域，包括：通过记忆模块并基于动态权重策略调整预设记忆库中的各当前记忆单元的重要性权重，按照重要性权重的大小顺序过滤低权重的记忆单元，以更新预设记忆库，获取当前预设记忆库；当预训练模型接收到用户发起的训练请求，输出满足相似度条件的若干目标相似度计算结果；将与各目标相似度计算结果对应的记忆单元作为目标记忆单元，对各目标记忆单元以及查询向量进行加权聚合，以训练记忆模块基于各目标记忆单元与查询向量输出对应的聚合记忆信息，并将聚合记忆信息输入至预训练模型，以便预训练模型根据聚合记忆信息与查询向量生成与查询请求对应的响应信息。

技术关键词

记忆单元预训练模型模型训练方法交叉注意力机制权重策略模块模型训练装置动态超参数存储计算机程序人工智能技术可读存储介质处理器标记电子设备主题字符通知

系统为您推荐了相关专利信息

阿尔茨海默病预测模型训练方法、阿尔茨海默病预测方法及设备

阿尔茨海默病磁共振成像数据预测模型训练方法深度学习模型分割图像数据

模型训练方法、动作识别方法、装置、设备及介质

模型训练方法动作识别方法参数终端设备环境感知数据

多模态数据驱动的产品众筹成功率预测方法与系统

分层混合模型文本处理模型图像处理模型融合特征交叉注意力机制

一种基于小样本电池采集数据的电池寿命预测方法及装置

电池寿命预测方法数据预训练模型验证算法样本

基于多物理传感信息的锂电池热失控预警方法

锂电池热失控预警方法编码器传感物理

一种对话模型训练方法、装置、设备及介质

站点导航

APP 下载