一种生成多会话对话的大语言模型

AITNT
正文
推荐专利
一种生成多会话对话的大语言模型
申请号:CN202411946785
申请日期:2024-12-27
公开号:CN119760096A
公开日期:2025-04-04
类型:发明专利
摘要
本发明提供一种生成多会话对话的大语言模型,包括原始大语言模型、VAE单元、LoRA单元和隐藏状态生成单元;VAE单元接收当前查询,或从对话历史中提取每轮对话中的查询,然后生成当前查询和对话历史对应的隐式向量表征,并将该隐式向量表征传送到隐藏状态生成单元;LoRA单元连接在原始大语言模型的每一层的输出之后,将每一层的输出叠加权重矩阵,然后将结果传送给隐藏状态生成单元;隐藏状态生成单元接收LoRA单元和VAE单元的输出以及原始大模型每一层的参数,将三者相加得到原始大语言模型每一层的新的隐藏状态。本发明可以生成和对话历史一致的回复,提升大语言模型的对话能力,可以丰富用户的对话体验并吸引用户的对话兴趣。
技术关键词
大语言模型 聊天机器人 参数 编码器 模块 矩阵 数据编码 传播算法 适配器 标签 兴趣 重构 文本 因子
系统为您推荐了相关专利信息
1
虚拟阻抗的构建方法、高带宽工况模拟测试方法及系统
虚拟阻抗控制 工况模拟测试系统 变流器 模拟测试方法 高带宽
2
一种锂离子电池健康状态预测方法
主成分分析方法 智能优化算法 充放电数据 特征值 锂电池健康状态
3
一种基于自适应熵深度强化学习的水平分舱产能优化方法
产能优化方法 深度强化学习 强化学习策略 连续动作空间 油藏模型
4
一种任务处理方法、系统、设备以及存储介质
场景 标识 参数 处理单元 关系
5
车辆中空调的控制方法、车辆中空调的控制装置和车辆
衣服 热阻 空调 车辆 可执行程序代码
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号