摘要
本发明提供一种基于博弈模型的AI人机协同决策优化方法及其系统,该方法通过构建包含AI参与者和人类参与者的博弈模型,设计双效用函数和联合效用函数平衡双方利益,采用深度神经网络实现AI策略函数并基于人类专家数据进行监督学习训练,引入温度参数调节和策略回退机制执行在线博弈训练,基于任务类型相似度进行动态适应性调整。本发明解决了现有AI人机协同系统中人机效用失衡、训练不稳定、泛化能力差等技术问题,实现了AI决策速度和人类干预成本的平衡优化,提高了模型在新任务场景下的快速适应能力,保证了训练过程的稳定性,显著提升了人机协同决策的整体效率。
技术关键词
决策优化方法
策略
检查点
深度神经网络
人类
数据管理单元
参数
人机协同系统
Softmax函数
标识
在线
语义
损失函数优化
序列
梯度方法
系统为您推荐了相关专利信息
优化调度模型
风光互补能源
增广拉格朗日
风光互补发电系统
生成场景
护眼仪内部组件
电流增幅率
交互方法
交互动作
热敷功能
中央管理服务器
资源分配策略
数据采集器
加密数据
故障分类模型