摘要
本发明公开了一种数据与机理融合的工控多模态生成式预训练模型构建方法,收集大量工业时序信号,以滑窗切割的方式划分出一定数量的样本,各个样本进行标准化预处理;以机理知识为依据,对各时序样本进行文本描述,进而形成大量的时序信号‑文本对并构建数据集;构建能使信号与文本多模态表示对齐的双编码器,所述双编码器包括信号编码器与文本编码器;构建在“文本+信号‑>信号”范式下的工控多模态生成式预训练模型。在保证文本描述的准确性和全面性的同时,减少文本标注成本。该方法通过表示对齐赋予信号显式的语义,从而支持后续模型中信号数据与文本知识的多模态深层次融合。使得预训练模型具有在下游任务上展现优异性能的潜能。
技术关键词
预训练模型
信号编码器
多模态
文本编码器
信号解码器
双编码器
样本
数据
时序
模版
语句
重构
语义
超参数
工业
数学
系统为您推荐了相关专利信息
智能问诊方法
动态知识图谱
数据处理单元
生理特征数据
多模态生理
速度控制策略
糖茶
监测管理方法
融合特征
塔格糖
分析模型构建方法
联合损失函数
信号采集装置
融合多模态特征
脑机接口技术
图像特征数据
大语言模型
图像特征提取
投影器
训练样本数据