基于有限理性博弈和可达性分析的人机交互安全控制方法

正文

推荐专利

申请号：CN202510429275

申请日期：2025-04-08

公开号：CN120276257A

公开日期：2025-07-08

类型：发明专利

摘要

本发明涉及人机交互安全控制技术领域，公开了一种基于有限理性博弈和可达性分析的人机交互安全控制方法，用于建模人机协同系统中对手的有限理性行为，形成高效的强化学习控制策略与低保守的基于后向可达管的安全控制策略相结合的控制框架。所述人机交互安全控制方法，包括：确定参与人机交互智能机器人的模型；使用递归推理建模有限理性智能体之间的交互；设计指导各智能体进行强化学习训练的奖励函数，并逐级训练每个智能体不同理性等级的控制策略；设计交互对手理性等级的推断方法；基于哈密尔顿‑雅可比可达性分析获得低保守人机协同系统的后向可达管和安全控制策略；用所确定的高效强化学习控制策略与低保守安全控制策略实现人机交互安全控制，使得机器人能够在识别人类理性等级并预测人类非最优行为的基础上进行最优动作选择，实现人机协同系统的安全、高效交互与协同。

技术关键词

人机协同系统安全控制方法控制策略水平集方法 SAC算法机器人人机交互智能连续状态空间强化学习环境萨克斯离散状态空间动态更新识别人类训练智能推断方法方程网格符号决策

系统为您推荐了相关专利信息

一种煤层打钻孔口杂质智能收集控制方法及系统

收集控制方法监控网络模拟模型设备状态传感器气体监测传感器

一种基于多级PID算法的恒温恒湿试验箱温度控制系统及其控制方法

恒温恒湿试验箱温度控制系统 PID算法冗余控制策略温度传感器阵列

用于科氏流量计的信号处理方法、模块及控制系统

科氏流量计信号处理方法信号处理模块鲸鱼算法幅值

一种多维度沉水植物补光设备

沉水植物补光设备传导纤维特种光纤太阳光水下沉水植物

用于混合动力玉米机的能量控制方法及系统

能量控制方法粒子群寻优算法历史工况数据能量控制策略收割作业状态

基于有限理性博弈和可达性分析的人机交互安全控制方法

站点导航

APP 下载