摘要
本申请公开了一种预训练大模型构建方法及其装置,涉及因果推断领域,所述预训练大模型构建方法包括:构建第一因果干预模块、第二因果干预模块和第三因果干预模块;第一因果干预模块根据无混杂情况的因果图构建;第二因果干预模块根据后门调整情况的因果图构建;第三因果干预模块根据前门调整情况的因果图构建的;根据三个因果干预模块构建多个因果层,然后将所有因果层进行加权连接得到任务模型;每个因果层包括加权连接的三个因果干预模块;对任务模型进行训练得到三个因果干预模块的权重以及每个因果层的权重;根据任务模型、三个因果干预模块的权重以及每个因果层的权重得到预训练大模型,本申请可满足从多样的因果图中去除混杂的要求。
技术关键词
注意力机制
模型构建方法
模块
多层感知器
模型构建装置
输入端
文档分类
前门
后门
动态
视觉
系统为您推荐了相关专利信息
分割识别方法
可见光图像
多维度特征提取
配准预处理
多尺度特征融合
人机交互模块
数据采集模块
存储模块
智能分析模块
音频
预检测方法
特征融合网络
光纤熔接器
高清摄像头
特征提取网络