摘要
本发明实施例公开了一种群聚智能体的自适应控制方法、训练方法及装置,涉及人工智能和计算机科学技术领域,其中,所述方法包括:为机器人的各关节构建关节智能体并配置连接关系,构建中枢智能体处理输入信息,为各关节智能体和中枢智能体设置参数共享和同步更新的机制,中枢智能体用于输出信号控制所述各关节智能体,获取真实运动数据和评价数据,根据真实运动数据和评价数据通过模仿学习和强化学习对各关节智能体和中枢智能体进行训练和优化后进行机器人控制。本发明通过为机器人各关节构建智能体并配置连接关系,以及构建处理多元输入信息的中枢智能体,解决了现有技术无法实现多任务、多场景的机器人控制,泛化能力和灵活性差的问题。
技术关键词
机器人训练方法
机器人控制方法
关节
数据
引入专家评价
计算机科学技术
机器人控制装置
语音信号处理
运动
神经网络参数
机制
强化学习算法
序列
预训练模型
文本
系统为您推荐了相关专利信息
应用程序兼容性测试方法
虚拟设备
设备通信
终端
节点
Django框架
特征可视化方法
深度学习模型
网页形式
可视化网页
大语言模型
自然语言
转换方法
语句
神经网络模型