机器学习方法、装置、设备及存储介质

正文

推荐专利

机器学习方法、装置、设备及存储介质

申请号：CN202511063479

申请日期：2025-07-30

公开号：CN120911541A

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及人工智能技术领域，本方案可应用于医疗、金融领域，本发明提供一种机器学习方法、装置、设备及存储介质，方法包括：采集专家演示数据；通过前向策略与后向策略的交替控制，获取交互数据；其中，交互数据包括前向交互数据及后向交互数据；利用前向目标状态数据及前向交互数据训练前向判别器，获取前向奖励信号；利用后向目标状态数据及后向交互数据训练后向判别器，获取后向奖励信号；基于强化学习的Actor‑Critic框架，引入Q值网络集成机制，结合前向奖励信号及后向奖励信号对所述前向策略及后向策略进行联合优化。本发明提升了机器人在复杂动态环境中的学习稳定性、策略适应性及自主提升能力。

技术关键词

机器学习方法数据策略信号机器学习装置机制网络处理器图像人工智能技术框架轨迹采集单元可读存储介质存储器机器人电子设备程序指令金融

系统为您推荐了相关专利信息

一种基于混合监督学习的非侵入式负荷辨识方法和系统

监督学习方法负荷辨识方法辨识系统电流无标签数据

一种接口数据预加载方法、产品、装置、设备及介质

数据预加载方法接口项链节点预加载装置

衣物脱水的控制方法、装置和洗衣机

神经网络模型偏心衣物数据控制洗衣机

一种面向图学习的联合任务与分布泛化方法

掩码矩阵精炼器泛化方法输入模块神经网络模型

图像编码模型训练方法、装置、计算机设备和存储介质

图像编码模型训练方法样本学习方法数据

机器学习方法、装置、设备及存储介质

站点导航

APP 下载