摘要
本申请实施例公开了一种数据处理方法和相关装置,可以针对每个训练数据设置对应的奖励函数,来分析模型针对该训练数据执行数据处理任务的执行效果,从而能够提高奖励函数与训练数据之间的匹配程度,以提高对基于奖励函数确定出的奖励分值的精准度,进而提高基于奖励分值进行模型训练的训练效果,最终使训练得到的数据处理模型具有更加优秀的数据处理能力。
技术关键词
数据处理模型
数据处理方法
标识
参数
计算机设备
数据执行数据处理
存储计算机程序
调节单元
可读存储介质
数据处理装置
计算机程序产品
处理器
关系
存储器
指令
系统为您推荐了相关专利信息
分布式共识
双层网络结构
密钥协商算法
信誉值计算方法
资源
故障诊断方法
风电机组运行数据
风电机组轴承
鲸鱼优化算法
重构误差
数据处理方法
飞行器模型
力矩
航空气动力风洞
信号