一种轨道交通智能客服专家混合大语言模型

正文

推荐专利

一种轨道交通智能客服专家混合大语言模型

申请号：CN202510588758

申请日期：2025-05-08

公开号：CN120525045A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种轨道交通智能客服专家混合大语言模型，涉及大语言模型技术领域，步骤一：数据初始化；步骤二：交互与数据采样；步骤三：离散动作训练，使用深度Q网络处理离散动作选择；步骤四：连续动作训练，使用策略梯度方法优化连续策略；步骤五：联合训练；步骤六：输出最优策略，该发明，离散动作训练中使用深度Q网络处理离散动作选择，连续动作训练中使用策略梯度方法优化连续策略，再配合联合训练，实现两种方法的协同优化，提升模型在复杂决策问题中的表现；联合训练中通过共享奖励信号和状态特征，通过对用户行为习惯、家庭身份和消费习惯三个维度进行数据采集，可以提高模型对用户更精确的训练输出。

技术关键词

轨道交通智能大语言模型深度Q网络客服梯度方法特征提取网络历史订单数据联合损失函数家庭特征值习惯身份生成轨迹策略更新参数数据存储模块

系统为您推荐了相关专利信息

一种角色与场景一致性对齐方法

对齐方法结构化场景大语言模型实体列表

一种文案内容生成方法、装置、计算机设备及存储介质

内容生成方法语义图谱生成文案内容生成装置

基于大语言模型的Text2SQL医疗数据处理方法和电子设备

医疗数据处理方法大语言模型语句分片计算机执行指令

一种考虑分段工艺属性的多堆场综合调度方法及系统

堆场分段综合调度方法布局优化算法平板车

一种噪声机制和锐度感知最小化的差分隐私联邦学习方法

联邦学习方法客户端差分隐私服务器噪声

一种轨道交通智能客服专家混合大语言模型

站点导航

APP 下载