摘要
本发明提供一种生成多会话对话的大语言模型,包括原始大语言模型、VAE单元、LoRA单元和隐藏状态生成单元;VAE单元接收当前查询,或从对话历史中提取每轮对话中的查询,然后生成当前查询和对话历史对应的隐式向量表征,并将该隐式向量表征传送到隐藏状态生成单元;LoRA单元连接在原始大语言模型的每一层的输出之后,将每一层的输出叠加权重矩阵,然后将结果传送给隐藏状态生成单元;隐藏状态生成单元接收LoRA单元和VAE单元的输出以及原始大模型每一层的参数,将三者相加得到原始大语言模型每一层的新的隐藏状态。本发明可以生成和对话历史一致的回复,提升大语言模型的对话能力,可以丰富用户的对话体验并吸引用户的对话兴趣。
技术关键词
大语言模型
聊天机器人
参数
编码器
模块
矩阵
数据编码
传播算法
适配器
标签
兴趣
重构
文本
因子
系统为您推荐了相关专利信息
虚拟阻抗控制
工况模拟测试系统
变流器
模拟测试方法
高带宽
主成分分析方法
智能优化算法
充放电数据
特征值
锂电池健康状态
产能优化方法
深度强化学习
强化学习策略
连续动作空间
油藏模型