策略优化方法、装置、设备和可读存储介质

正文

推荐专利

策略优化方法、装置、设备和可读存储介质

申请号：CN202510514679

申请日期：2025-04-22

公开号：CN120450080A

公开日期：2025-08-08

类型：发明专利

摘要

本公开的实施例提供了用于策略优化的方法、装置、设备和可读存储介质。该方法包括：基于与第一组对象对应的源数据集，确定属性关联信息，源数据集包括第一组对象中的每个对象的属性、是否对该对象应用目标动作的指示和与该对象相关的观测结果，属性关联信息指示根据源数据集而得到的对象观测数据与对象属性的关联；基于第一组对象的数目和与目标数据集对应的第二组对象的数目，确定用于将属性关联信息从源数据集变换到目标数据集的变换因子，目标数据集包括第二组对象中的每个对象的属性；基于是否对第一组对象和第二组对象中的样本对象应用目标动作的样本决策、属性关联信息和变换因子确定针对策略模型的奖励；以及利用奖励来更新策略模型。

技术关键词

对象样本决策数据因子策略优化方法计算机可执行指令效应处理器机器人计算机程序产品模型更新电子设备可读存储介质模块存储器规划

系统为您推荐了相关专利信息

一种电缆隧道导航路径识别方法、装置、终端设备及存储介质

电缆隧道道路边界检测导航路径识别方法坐标点检测道路边界

一种光伏项目勘测数据集成与分析平台

深度学习模型人工智能模型项目光伏发电量卷积神经网络模型

一种场景点云的多模态大模型数据生成方法、系统、设备及介质

模型数据生成方法计算机可执行指令大语言模型场景多模态

一种基于加权图卷积网络的微弱目标检测方法

节点序列雷达 GCN模型样本

洗钱行为的预测方法、装置、电子设备及存储介质

序列多头注意力机制特征学习网络交易特征电子设备

策略优化方法、装置、设备和可读存储介质

站点导航

APP 下载