一种针对期望型约束的决策控制策略生成方法及装置

AITNT
正文
推荐专利
一种针对期望型约束的决策控制策略生成方法及装置
申请号:CN202510146097
申请日期:2025-02-10
公开号:CN120178665A
公开日期:2025-06-20
类型:发明专利
摘要
本说明书实施例涉及控制与决策技术领域,提供了一种针对期望型约束的决策控制策略生成方法及装置,包括:根据目标智能体的期望型约束构建包括行动价值函数和行动约束价值函数的约束马尔科夫模型;根据行动价值函数和行动约束价值函数,建模得到每一状态动作对的行动价值正态分布模型和行动约束价值正态分布模型,根据行动价值正态分布模型和行动约束价值正态分布模型确定每一状态动作对的均值和方差,从而计算得到智能体在每一状态动作对的采样概率;根据采样概率对智能体动作空间中的动作进行迭代采样,得到目标智能体的最优决策控制策略。通过本说明书实施例,能够提高渐进获得最大最优策略的概率,整体提升采样效率。
技术关键词
正态分布模型 马尔科夫模型 控制策略生成方法 智能车系统 决策 处理器 可读存储介质 神经网络模型 整体提升 计算机程序产品 生成装置 计算机设备 输出模块 存储器 因子
系统为您推荐了相关专利信息
1
基于金融决策模型的交易评估报告生成方法及其装置
评估报告生成方法 金融 记忆机制 决策 对象
2
算网环境下基于双代理策略的任务调度优化方法
任务调度优化方法 服务器 处理器 策略更新 卸载策略
3
一种配电终端的故障诊断方法、装置、设备及存储介质
配电终端 证据理论算法 实体 缺陷现象 故障诊断方法
4
自动驾驶系统的重启方法、装置、设备及可读存储介质
自动驾驶系统 重启方法 信号 决策 功能模块
5
一种基于固废地质聚合物的新污染物髙效膜处理智能装备
地质聚合物 智能装备 弹性缓冲垫片 支撑框架 膜体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号