摘要
本发明公开了一种基于大语言模型的词嵌入向量提取方法及系统,属于自然语言处理领域,一种基于大语言模型的词嵌入向量提取方法包括以下步骤:S1.嵌入全局上下文注意力模块,通过线性变换生成Q/K/V向量,跨位置计算全局注意力权重;S2.拼接相邻层编码特征,门控融合生成全局上下文动态语义状态;S3.多头注意力联合编码当前层与全局动态语义状态;S4.平均池化生成全局语义向量,计算动态注意力权重;S5.动态权重与全局向量加权融合生成增强型编码;S6.GELU非线性变换全连接层输出最终词向量;有益效果包括增强全局上下文语义捕捉能力,提升词嵌入向量的表达效果。
技术关键词
向量提取方法
大语言模型
动态
词嵌入向量
Softmax函数
矩阵
融合上下文信息
Sigmoid函数
线性单元
注意力机制
非线性
输出模块
序列
语义向量
编码特征
融合特征
系统为您推荐了相关专利信息
智能生成方法
多模型协同
生成工作
电气
大语言模型
大气扩散模型
混合分布模型
动态输入参数
辐射监测数据
网络节点
资源动态调度方法
资源消耗量
任务调度
执行效能
总量
蜂窝网格
动画
司机
订单
MapReduce模型