摘要
本说明书实施例提供一种基于事务决策的基于事务决策的模型训练方法、装置与电子设备,该方法包括:通过获取模型集合和样本用户的样本用户特征,模型集合包括目标事务方模型和至少一个关联事务方模型,将样本用户特征分别输入模型集合中的各模型,基于全局状态参数、样本用户特征、各模型的内部状态参数和行为规则生成各模型对应的样本事务决策结果,确定样本用户针对目标事务方模型的样本事务决策结果的真实选择结果,基于真实选择结果确定针对各模型的决策奖惩值,根据各模型的目标函数、决策奖惩值和样本事务决策结果更新模型集合,训练好的模型集合中的目标事务方模型用于基于目标用户的目标用户特征生成事务决策结果。
技术关键词
样本
决策
大语言模型
模型训练方法
电子设备
模型训练装置
处理器
计算机程序产品
信息更新
存储器
方针
数据
系统为您推荐了相关专利信息
大语言模型
时序神经网络
分析系统
人物关系图谱
模型训练模块
系统故障检测方法
守时系统
矩阵
数据
前馈神经网络
亚临床甲状腺功能
心血管疾病风险
高效液相色谱质谱联用技术
花生四烯酸
生物标志物