一种基于在线数据的价值函数持续学习方法及系统

正文

推荐专利

申请号：CN202510475337

申请日期：2025-04-16

公开号：CN119989068A

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供一种基于在线数据的价值函数持续学习方法与系统，其中方法包括：基于当前学习的价值，推断生成期望价值并进一步确定出对应的流态，使用生成模型，生成流态对应的第一数据样本；发布任务及任务场景，接收其他用户对于任务的操作生成相应的场景数据；对场景数据进行处理，获得第二数据样本；将第一数据样本和第二数据样本添加进原训练数据样本中，并对训练数据样本进行处理后，重新对价值函数进行训练。本发明的基于在线数据的价值函数持续学习方法及系统，实现有效持续地在线数据的收集，保证了价值函数的持续学习更新，以保证人工智能系统的有效更新。

技术关键词

持续学习方法数据学习系统样本场景对象在线参数神经网络模型人工智能系统因子模块

系统为您推荐了相关专利信息

可靠性预测方法、装置、设备、存储介质和程序产品

配电系统马尔可夫模型可靠性预测方法指标计算机程序产品

基于中医药配方的平台构建方法、装置、设备及介质

中医药配方关键词基座词语关系文本

基于用户行为数据和闪信的气象预警信息推送方法及设备

气象预警信息气象灾害预警推送方法模板预警模块

一种基于误差状态卡尔曼网络的多模态融合感知方法

误差状态状态空间模型全球导航卫星系统状态估计器 RNN模型

回环检测方法、设备以及车辆

回环检测方法空间划分树多分辨率节点坐标

一种基于在线数据的价值函数持续学习方法及系统

站点导航

APP 下载