摘要
本发明涉及数字信号处理技术领域的一种基于参数化动作空间的深度策略查找表训练方法,包括如下步骤:S1,策略网络训练;S2,策略查找表构建;S3,查找表推理与插值。通过上述设计,本发明的方法将“强化学习策略离线训练 + 查找表在线快速执行”这一轻量级智能决策框架成功拓展到图像、音频、传感器信号、光谱数据及实时控制领域,既保证了处理结果的高质量与可解释性,又极大降低了计算资源消耗与延迟,为各类信号处理与智能决策任务提供了通用且高效的解决方案。
技术关键词
查找表
像素
网络
参数
数字信号处理技术
强化学习技术
强化学习策略
校正策略
图像
插值算法
滤波器
决策
离线
度量
音频
传感器
规模