智能体的强化学习方法、训练设备及存储介质

正文

推荐专利

申请号：CN202510901667

申请日期：2025-06-30

公开号：CN120781868A

公开日期：2025-10-14

类型：发明专利

摘要

本说明书提供一种智能体的强化学习方法、训练设备及存储介质。智能体的强化学习方法包括：训练设备可以获取包括含第一动线任务对应的第一任务意图和第一历史动作序列的第一样本数据，然后，将第一样本数据输入第一智能体，并通过第一智能体对第一样本数据执行多次预测操作，获得第一智能体在多次预测操作中得到的多个预测动作。接着，训练设备可以确定多个预测动作各自对应的相对优势信息，并基于多个预测动作各自对应的相对优势信息对第一智能体的决策策略进行调整，以实现对第一智能体的强化学习。

技术关键词

计算机可读非易失性存储介质样本强化学习方法训练设备数据意图序列人机交互界面决策策略处理器移动终端规模参数

智能体的强化学习方法、训练设备及存储介质

站点导航

APP 下载