摘要
本发明提供了一种基于知识引导的因果发现方法、装置、设备及介质,方法包括:从所述企业宏观月度指标数据集X的m个样本中随机抽取n个样本构建训练样本集利用编码器将每个训练样本xj嵌入到状态sj,根据所有嵌入的状态构成完整的状态空间利用解码器将状态空间映射到动作空间A,输出对应的变量;所有的变量选择完毕后形成初始排序Π;采用直接插入排序的思想来调整初始排序Π获取调整排序Π',通过比较知识奖励函数来获取最优排序Π*;根据最优排序Π*和搜索到的初始排序Π进行对比,将变动的节点前后关系作为先验知识,通过搜索的迭代过程不断更新先验知识,引导强化学习找到全局最优解;对全局最优解进行变换得到因果结构。
技术关键词
变量
指标
企业
编码器
解码器
策略
训练样本集
高斯噪声方差
节点
数据
前馈神经网络
计算机
解码单元
决策
索引
处理器通信
指令
系统为您推荐了相关专利信息
观点
个性化新闻推荐
注意力机制
预训练语言模型
语义
飞行状态数据
地面试车
融合特征
涡扇航空发动机
注意力
排查系统
企业信息数据
环境监测数据
数据存储模块
分析模块