摘要
本公开提供了一种信息处理方法,涉及人工智能技术领域,尤其涉及大模型、强化学习、深度学习、分布式训练和分布式推理等技术领域。具体实现方案为:根据至少一个问题信息以及用于至少一个问题信息的至少一个初始响应结果,确定至少一个目标训练样本,初始响应结果是推理服务层利用待训练模型根据问题信息进行推理得到的;将至少一个目标训练样本提供给训练服务层,训练服务层用于:根据至少一个目标训练样本确定待训练模型的权重更新数据;以及将权重更新数据提供给推理服务层。本公开还提供了一种分布式信息处理系统、装置、电子设备和存储介质。
技术关键词
硬件设备
分布式信息处理系统
规模
信息处理方法
人工智能芯片
策略
分布式训练
通信网络
电子设备
信息处理装置
人工智能技术
计算机程序产品
处理器通信
数据更新
指令
控制设备
可读存储介质