一种预训练大模型构建方法及其装置

正文

推荐专利

一种预训练大模型构建方法及其装置

申请号：CN202510885418

申请日期：2025-06-27

公开号：CN120725145A

公开日期：2025-09-30

类型：发明专利

摘要

本申请公开了一种预训练大模型构建方法及其装置，涉及因果推断领域，所述预训练大模型构建方法包括：构建第一因果干预模块、第二因果干预模块和第三因果干预模块；第一因果干预模块根据无混杂情况的因果图构建；第二因果干预模块根据后门调整情况的因果图构建；第三因果干预模块根据前门调整情况的因果图构建的；根据三个因果干预模块构建多个因果层，然后将所有因果层进行加权连接得到任务模型；每个因果层包括加权连接的三个因果干预模块；对任务模型进行训练得到三个因果干预模块的权重以及每个因果层的权重；根据任务模型、三个因果干预模块的权重以及每个因果层的权重得到预训练大模型，本申请可满足从多样的因果图中去除混杂的要求。

技术关键词

注意力机制模型构建方法模块多层感知器模型构建装置输入端文档分类前门后门动态视觉

系统为您推荐了相关专利信息

一种基于可见光和红外模态融合的目标分割识别方法

分割识别方法可见光图像多维度特征提取配准预处理多尺度特征融合

一种基于动态稀疏激活的轻量化模型自适应压缩系统

压缩系统设备运行监测模型压缩模块算法

可支持自动听力测试的检测设备及其使用方法

人机交互模块数据采集模块存储模块智能分析模块音频

一种智能光纤熔接辅助操作装置、熔接状态预检测方法及存储介质

预检测方法特征融合网络光纤熔接器高清摄像头特征提取网络

一种基于动态密钥的软件数据加密方法及系统

数据加密方法动态密钥分片种子流加密

一种预训练大模型构建方法及其装置

站点导航

APP 下载