一种在线司乘匹配方法、介质及设备

正文

推荐专利

一种在线司乘匹配方法、介质及设备

申请号：CN202510386258

申请日期：2025-03-28

公开号：CN120317578A

公开日期：2025-07-15

类型：发明专利

摘要

本发明提供了一种在线司乘匹配方法、介质及设备，属于在线二部图匹配技术领域，其中提出了一套基于分层强化学习的策略架构，对未来信息进行预测来指导当前的决策，先训练不同的底层策略，再训练高层模型选择底层策略以优化长期总收益。匹配时间片的收益和状态转移遵循特定规则，状态包括司机和订单特征，动作是通过停止策略决定是否改变底层策略，若改变则由高层策略选择合适的底层策略。本发明采用分层强化学习架构，解决了训练效率与决策性能的权衡难题，降低决策复杂度，提高训练效率，确保在复杂动态环境下能快速准确做出高质量决策，提升系统整体性能。

技术关键词

策略司机分层强化学习订单在线神经网络架构时间片决策传播算法深度Q网络队列节点特征提升系统参数处理器可读存储介质关系存储器

系统为您推荐了相关专利信息

一种智能物联网家居能源管理系统

物联网家居能源管理系统采集人体生理数据风险识别模型智能设备接口

一种基于物联网的净水设备控制优化系统

净水设备仿真模型泄露故障反渗透系统 RO膜

智能虚拟陪伴机器人情景对话节奏控制系统

节奏控制系统陪伴机器人声学特征情景语音

一种环境感知的水声通信体制自适应切换方法

水声通信体制切换方法多普勒识别算法信噪比

一种智能园区用能设备能效检测装置

能效检测装置多模态数据采集基线 LSTM模型能效检测技术

一种在线司乘匹配方法、介质及设备

站点导航

APP 下载