模型预测任务采样的元强化学习和域随机化训练方法

AITNT
正文
推荐专利
模型预测任务采样的元强化学习和域随机化训练方法
申请号:CN202411934200
申请日期:2024-12-26
公开号:CN119940483A
公开日期:2025-05-06
类型:发明专利
摘要
本申请涉及一种模型预测任务采样的元强化学习和域随机化训练方法,其中,方法包括:构建在线构建的深度生成模型的风险随机函数,且确定其风险函数分布,并推断风险函数分布的近似后验;估算深度生成模型的函数后验分布,以构建目标采集函数,且利用目标采集函数在目标任务空间进行随机采样,得到后验任务自适应损失的预测值和对应的采集数据,并通过预测值和风险学习器预测采集数据的采集分数生成目标情节优化任务批次;确定机器学习器的域随机化和元强化学习更新规则,从而对机器学习器执行在目标零样本或目标小样本的自适应模型中的决策模型更新训练操作。由此,解决了现有技术难以在提高自适应鲁棒性的同时,改善模型的计算效率等问题。
技术关键词
深度生成模型 风险 机器学习器 标识符 神经网络参数 模型更新 变量 策略 决策 数据 样本 在线 计算机程序产品 处理器 编码 表达式 训练装置 转换单元 数学
系统为您推荐了相关专利信息
1
一种数据审计方法、装置、设备及计算机可读存储介质
数据审计方法 语义规则 信息验证 标识符 云端
2
保险防欺诈预测方法及系统
生命体征监测 模式 生理反应 指纹 生理特征数据
3
一种用于应急指挥辅助决策大模型方法及系统
关键词 风险 监测平台 决策 扩展检索词
4
一种基于大模型的自动化代码生成与优化方法及系统
漏洞 语义分析模型 指令间数据依赖 语义特征 序列
5
一种数据处理方法、装置、电子设备和存储介质
列表 逻辑 对象 云端 数据处理方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号