摘要
本申请公开了一种智能体的行为决策方法、装置及电子设备,属于人工智能技术领域。方法包括:根据智能体的行为能力函数确定智能体在当前状态下的行为集合;根据行为集合确定智能体从当前状态到目标状态的多条行为轨迹;根据认知架构函数基于对智能体当前的认知计算多条行为轨迹对应的成本,以及根据价值偏好函数基于对智能体当前的偏好计算多条行为轨迹对应的价值;以最大化价值和最小化成本为优化目标,从多条行为轨迹中选择满足优化目标的目标行为轨迹。本申请综合考虑了智能体的行为能力、认知架构和价值偏好,使得智能体能够从容面对复杂、多变的环境,提升智能体的自主学习能力和适应能力,提高智能体的决策准确性和效率。
技术关键词
轨迹
决策方法
非暂态计算机可读存储介质
电子设备
人工智能技术
处理器
意图
参数
模块
存储器
程序
系统为您推荐了相关专利信息
交通场景图像
交通违章识别
行车记录仪
车辆跟踪算法
车道
FPGA板卡
板卡接口
通信模块
硬件资源信息
芯片
决策
车辆运行数据
神经网络模型
强化学习技术
可读存储介质