摘要
本发明公开一种基于边缘探测的多模态大语言模型隐喻表征方法,所述方法基于表征提取模块、池化模块、层级模块和分类器,包括通过离线阶段和训练阶段,按照以下步骤:将包含隐喻、非隐喻标签的数据输入多模态大语言模型提取隐藏表征数据h;对所述隐藏表征h按照256维空间的线性投影获得隐藏表征张量矩阵z;通过自适应注意力机制对隐藏表征张量矩阵进行池化和归一化处理获得隐藏池化表征矩阵p(i);对隐藏池化表征矩阵进行层级加权求和获得隐藏加权表征v;对于隐藏加权表征进行预测输入数据中是否包含隐喻标签使用交叉熵损失函数对预测结果与真实标签之间的差异,并通过反向传播算法不断调整分类器的参数;本发明仅需训练小规模分类器即可探究多模态大语言模型是否编码了隐喻信息,后续研究多模态模型的语义表征能力提供了有效的分析工具。
技术关键词
大语言模型
表征方法
多模态
矩阵
注意力机制
分类器
传播算法
标签
层级
分析工具
阶段
模块
数据
线性
离线
小规模
参数
序列
语义
系统为您推荐了相关专利信息
反射率数据
土壤重金属含量
反演模型
XGBoost模型
定量反演方法
文本
大语言模型
计算中心
生成提示词
生成提示信息