摘要
本公开公开了模型的生成方法、装置、电子设备及存储介质,涉及计算机领域,尤其涉及大模型、深度学习、强化学习等人工智能技术领域。具体实现方案为:首先获取输入信息序列,并基于输入信息序列中每个输入信息对应的数据长度,将输入信息序列进行排序,得到排序结果,然后基于负载均衡策略,将排序结果分配至多个数据并行组,以得到初始策略网络输出的输入信息序列对应的预测结果序列,之后基于初始价值网络,确定预测结果序列中每个预测结果对应的奖励值,最后基于奖励值,分别对初始策略网络及初始价值网络进行修正,直至得到目标模型。
技术关键词
负载均衡策略
序列
网络
生成方法
数据
电子设备
人工智能技术
计算机程序产品
处理器通信
模块
生成装置
指令
可读存储介质
存储器
节点
字符
语义
系统为您推荐了相关专利信息
关键词
推荐方法
缺陷分析
权重算法
计算机程序产品
参数优化模型
历史工况数据
辊轧设备
优化工艺参数
叶片
检索系统
大语言模型
检索方法
评估系统
检索平台
收发电路系统
超声回波
神经网络处理单元
主控模块
模拟低通滤波器