摘要
本发明提供一种赋予大语言模型多模态情感分析能力的方法及系统,涉及情感分析技术领域,该方法包括获取待测样本的文本、音频和视觉数据;对文本、音频和视觉数据分别进行特征提取,生成文本嵌入序列T、音频嵌入向量A和视觉嵌入向量V;将所述音频嵌入向量A和视觉嵌入向量V输入MSA适配器,依次通过特征对齐、特征融合及投影处理,生成伪令牌序列P;将所述伪令牌序列与文本嵌入序列及任务提示嵌入序列拼接为输入序列S,输入冻结参数的大语言模型进行情感预测。本发明提供的方法实现多模态数据与大语言模型的无缝衔接,既保留大语言模型泛化能力,又降低计算成本,为后续特征对齐、融合提供基础框架。
技术关键词
多模态情感分析
大语言模型
序列
文本
音频
视觉
令牌
融合特征
适配器
情感分析技术
多尺度特征提取
长短期记忆网络
面部关键点
生成多尺度
全局平均池化
韵律特征
存储计算机程序
特征提取模块
多层感知机
数据获取模块
系统为您推荐了相关专利信息
短期负荷预测方法
注意力模型
长短期记忆网络
数据处理模块
负荷预测技术
石油管道
预警监控方法
融合注意力机制
管道运行状态
预警模型
自动构建方法
模型库
SysML模型
节点
子系统结构
布局方式
广告图片生成方法
页面
广告模板
背景图