摘要
本发明提供一种多模态大语言模型建立方法、介质及系统,属于计算机模型技术领域,本发明提出的多模态大语言模型建立方法,首先对文本、图像、音频数据进行标准化预处理,然后构建包含双向长短时记忆网络、残差网络和一维卷积网络的特征提取结构。通过对齐度函数评估特征提取效果,基于对齐分量矩阵计算拆分指数,并构建模态贡献分配模型评估特征重要性。最后利用注意力机制实现特征融合,通过分类器层和损失函数优化完成模型训练。该方法通过特征对齐优化和贡献值分配实现了高效的多模态特征融合,解决了现有技术中存在的多模态特征对齐不足导致特征融合效果差的技术问题。
技术关键词
多层卷积神经网络
大语言模型
音频特征提取
图像特征提取
注意力机制
多模态特征
度函数
可读存储介质
构建分类器
一维卷积神经网络
计算机
文本
数据
残差网络
残差神经网络
矩阵
系统为您推荐了相关专利信息
推荐方法
语义
注意力机制
物品特征
训练推荐模型
花生荚果
掩膜
图像拍摄设备
图像增强
深度学习语义分割
课程推荐方法
课程推荐系统
画像模型
大数据
标签模块