一种针对期望型约束的决策控制策略生成方法及装置

正文

推荐专利

申请号：CN202510146097

申请日期：2025-02-10

公开号：CN120178665A

公开日期：2025-06-20

类型：发明专利

摘要

本说明书实施例涉及控制与决策技术领域，提供了一种针对期望型约束的决策控制策略生成方法及装置，包括：根据目标智能体的期望型约束构建包括行动价值函数和行动约束价值函数的约束马尔科夫模型；根据行动价值函数和行动约束价值函数，建模得到每一状态动作对的行动价值正态分布模型和行动约束价值正态分布模型，根据行动价值正态分布模型和行动约束价值正态分布模型确定每一状态动作对的均值和方差，从而计算得到智能体在每一状态动作对的采样概率；根据采样概率对智能体动作空间中的动作进行迭代采样，得到目标智能体的最优决策控制策略。通过本说明书实施例，能够提高渐进获得最大最优策略的概率，整体提升采样效率。

技术关键词

正态分布模型马尔科夫模型控制策略生成方法智能车系统决策处理器可读存储介质神经网络模型整体提升计算机程序产品生成装置计算机设备输出模块存储器因子

系统为您推荐了相关专利信息

基于金融决策模型的交易评估报告生成方法及其装置

评估报告生成方法金融记忆机制决策对象

算网环境下基于双代理策略的任务调度优化方法

任务调度优化方法服务器处理器策略更新卸载策略

一种配电终端的故障诊断方法、装置、设备及存储介质

配电终端证据理论算法实体缺陷现象故障诊断方法

自动驾驶系统的重启方法、装置、设备及可读存储介质

自动驾驶系统重启方法信号决策功能模块

一种基于固废地质聚合物的新污染物髙效膜处理智能装备

地质聚合物智能装备弹性缓冲垫片支撑框架膜体

一种针对期望型约束的决策控制策略生成方法及装置

站点导航

APP 下载