模型优化方法、装置、电子设备和计算机可读存储介质

AITNT
正文
推荐专利
模型优化方法、装置、电子设备和计算机可读存储介质
申请号:CN202411483690
申请日期:2024-10-23
公开号:CN119647551A
公开日期:2025-03-18
类型:发明专利
摘要
本申请提供了一种模型优化方法、装置、电子设备和计算机可读存储介质,涉及强化学习技术领域,本申请提供的模型优化方法通过从智能体与环境以往交互所产生的历史策略经验中筛选出高质量的历史策略经验,然后利用高质量的历史策略经验和由总变差距离构建得到奖励函数优化智能体所采用的策略,不仅能够在强化学习中提高历史经验样本的利用率,并且还能够减少强化学习中智能体与环境交互所需的成本和时间,并且引入的奖励函数可以将策略差异作为负奖励,从而限制策略更新的幅度,有利于确保策略的稳定性。
技术关键词
模型优化方法 可执行程序代码 可读存储介质 电子设备 强化学习技术 优化装置 计算机 策略更新 存储器 广义 模块 处理器 样本
系统为您推荐了相关专利信息
1
一种抛放记录器北斗维护方法、系统、设备及介质
FPGA逻辑单元 数据管理模块 抛放记录器 管理设备 北斗模块
2
三维模型裁剪方法、装置、电子设备和存储介质
三维模型 倾斜航空影像 裁剪方法 边缘轮廓 非暂态计算机可读存储介质
3
一种用于隔离区办证的在线学习考核评估方法及系统
深度置信网络模型 考核评估方法 在线学习平台 数据 考核评估系统
4
一种计量与营销系统档案数据评估与同步方法、系统、设备及存储介质
营销系统 同步方法 关联规则挖掘算法 计量系统 数据同步
5
低空视角下的交通拥堵识别方法及其相关设备
交通拥堵识别方法 图像像素 路段 交通道路拥堵 行驶车辆
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号