摘要
本发明实施例提供一种面向电力多模态数据的网络训练方法及系统,属于人工智能技术领域。所述网络训练方法包括:获取待训练的多模态数据;对所述多模态数据进行初步划分,以得到多个数据类;基于所述数据类的数据量构建注意力机制;将所述多模态数据输入特征预提取层中,以得到对应的初步特征;采用注意力机制对所述初步特征进行加权操作;采用加权操作后的所述初步特征训练构建好的电力大语言模型。该网络训练方法及系统通过针对多模态数据的数据量生成注意力机制,并结合注意力机制进行网络训练。相较于现有技术,本发明提供的网络训练方法及系统由于是直接基于数据量来构建注意力机制,避免了在网络内嵌入注意力机制导致的算力需求。
技术关键词
网络训练方法
注意力机制
大语言模型
训练系统
电力
数据特征提取
多模态交互
图像特征提取
特征提取单元
可读存储介质
人工智能技术
文本
计算机
处理器
编码器
指令
系统为您推荐了相关专利信息
概率预测方法
Stacking模型
斯皮尔曼相关系数
训练算法
线性插值方法
煤矸石快速检测
煤矸石检测系统
煤矸石分选设备
抓取系统
输出模块
脉冲神经网络模型
数据识别方法
动态视觉传感器
sigmoid函数
计算机设备