一种生成多会话对话的大语言模型

正文

推荐专利

一种生成多会话对话的大语言模型

申请号：CN202411946785

申请日期：2024-12-27

公开号：CN119760096A

公开日期：2025-04-04

类型：发明专利

摘要

本发明提供一种生成多会话对话的大语言模型，包括原始大语言模型、VAE单元、LoRA单元和隐藏状态生成单元；VAE单元接收当前查询，或从对话历史中提取每轮对话中的查询，然后生成当前查询和对话历史对应的隐式向量表征，并将该隐式向量表征传送到隐藏状态生成单元；LoRA单元连接在原始大语言模型的每一层的输出之后，将每一层的输出叠加权重矩阵，然后将结果传送给隐藏状态生成单元；隐藏状态生成单元接收LoRA单元和VAE单元的输出以及原始大模型每一层的参数，将三者相加得到原始大语言模型每一层的新的隐藏状态。本发明可以生成和对话历史一致的回复，提升大语言模型的对话能力，可以丰富用户的对话体验并吸引用户的对话兴趣。

技术关键词

大语言模型聊天机器人参数编码器模块矩阵数据编码传播算法适配器标签兴趣重构文本因子

系统为您推荐了相关专利信息

虚拟阻抗的构建方法、高带宽工况模拟测试方法及系统

虚拟阻抗控制工况模拟测试系统变流器模拟测试方法高带宽

一种锂离子电池健康状态预测方法

主成分分析方法智能优化算法充放电数据特征值锂电池健康状态

一种基于自适应熵深度强化学习的水平分舱产能优化方法

产能优化方法深度强化学习强化学习策略连续动作空间油藏模型

一种任务处理方法、系统、设备以及存储介质

场景标识参数处理单元关系

车辆中空调的控制方法、车辆中空调的控制装置和车辆

衣服热阻空调车辆可执行程序代码

一种生成多会话对话的大语言模型

站点导航

APP 下载