目标策略模型的训练方法、指令执行方法、装置及介质

正文

推荐专利

申请号：CN202411525238

申请日期：2024-10-29

公开号：CN119398129A

公开日期：2025-02-07

类型：发明专利

摘要

公开了一种目标策略模型的训练方法、指令执行方法、装置及介质。其中，目标策略模型的训练方法包括：确定待执行的指令序列；确定用于执行指令序列硬件的内存占用信息；基于指令序列、内存占用信息以及初始策略模型，确定指令序列对应的执行方式；对执行方式进行评估，得到评估信息；基于指令序列、内存占用信息、执行方式以及评估信息，对初始策略模型进行迭代训练；响应于迭代训练后的初始策略模型满足预设训练结束条件，将迭代训练后的初始策略模型作为目标策略模型。本公开的实施例可以提升指令序列的执行效率。

技术关键词

序列策略内存指令执行方法模块指令执行装置强化学习算法训练装置电子设备处理器可读存储介质网络存储器计算机

系统为您推荐了相关专利信息

一种基于多智能体自主协同的政策动态监测方法及系统

动态监测方法动态监测系统大语言模型语义可读存储介质

一种基于模型注意力分散的三维对抗样本生成方法

样本生成方法注意力纹理白盒多策略融合

一种城市轨道交通全直流供电系统及其控制方法

多端口能量路由器双有源全桥变换器直流供电系统三端口模块化多电平换流器

基于群体智能算法的地下电缆监控数据整合方法和系统

群体智能算法地下电缆监控数据融合算法数据整合方法故障诊断模型

图像生成模型的训练方法、图像处理方法及装置

图像生成模型速率图像处理方法参数图像处理模块

目标策略模型的训练方法、指令执行方法、装置及介质

站点导航

APP 下载