基于参数化动作空间的深度策略查找表训练方法

正文

推荐专利

申请号：CN202510848410

申请日期：2025-06-24

公开号：CN120822583A

公开日期：2025-10-21

类型：发明专利

摘要

本发明涉及数字信号处理技术领域的一种基于参数化动作空间的深度策略查找表训练方法，包括如下步骤：S1，策略网络训练；S2，策略查找表构建；S3，查找表推理与插值。通过上述设计，本发明的方法将“强化学习策略离线训练 + 查找表在线快速执行”这一轻量级智能决策框架成功拓展到图像、音频、传感器信号、光谱数据及实时控制领域，既保证了处理结果的高质量与可解释性，又极大降低了计算资源消耗与延迟，为各类信号处理与智能决策任务提供了通用且高效的解决方案。

技术关键词

查找表像素网络参数数字信号处理技术强化学习技术强化学习策略校正策略图像插值算法滤波器决策离线度量音频传感器规模

基于参数化动作空间的深度策略查找表训练方法

站点导航

APP 下载