机器学习方法、装置、设备及存储介质

AITNT
正文
推荐专利
机器学习方法、装置、设备及存储介质
申请号:CN202511063479
申请日期:2025-07-30
公开号:CN120911541A
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及人工智能技术领域,本方案可应用于医疗、金融领域,本发明提供一种机器学习方法、装置、设备及存储介质,方法包括:采集专家演示数据;通过前向策略与后向策略的交替控制,获取交互数据;其中,交互数据包括前向交互数据及后向交互数据;利用前向目标状态数据及前向交互数据训练前向判别器,获取前向奖励信号;利用后向目标状态数据及后向交互数据训练后向判别器,获取后向奖励信号;基于强化学习的Actor‑Critic框架,引入Q值网络集成机制,结合前向奖励信号及后向奖励信号对所述前向策略及后向策略进行联合优化。本发明提升了机器人在复杂动态环境中的学习稳定性、策略适应性及自主提升能力。
技术关键词
机器学习方法 数据 策略 信号 机器学习装置 机制 网络 处理器 图像 人工智能技术 框架 轨迹 采集单元 可读存储介质 存储器 机器人 电子设备 程序 指令 金融
系统为您推荐了相关专利信息
1
一种基于混合监督学习的非侵入式负荷辨识方法和系统
监督学习方法 负荷辨识方法 辨识系统 电流 无标签数据
2
一种接口数据预加载方法、产品、装置、设备及介质
数据预加载方法 接口 项链 节点 预加载装置
3
衣物脱水的控制方法、装置和洗衣机
神经网络模型 偏心 衣物 数据 控制洗衣机
4
一种面向图学习的联合任务与分布泛化方法
掩码矩阵 精炼器 泛化方法 输入模块 神经网络模型
5
图像编码模型训练方法、装置、计算机设备和存储介质
图像编码 模型训练方法 样本 学习方法 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号