摘要
本发明提供一种层次化概念预测的大语言建模方法,旨在通过该方法提升大语言模型的效率和推理表现。包括:使用时序多尺度离散量化自动编码器(Seq‑MultiScale VQVAE)将以文本为代表的时序数据转换为层次化概念令牌树,提出一种基于层次化概念令牌树的概率语言模型,以及基于该令牌树概率语言模型的自回归建模方法。相比传统的预测下一个词,本发明提出的层次化概念预测的大语言建模方法通过预测下一个概念,具有更好的数据效率,能够取得更好的推理表现;此外基于层次化概念令牌树的概率模型能够极大地减少相应自回归方法的注意力长度,从而提升训练和推理效率。
技术关键词
令牌
语言建模方法
概念
节点
自动编码器
变换器
时序
回归方法
层级
文本
解码
定义
双线性插值
音视频
多尺度
大语言模型
序列特征
系统为您推荐了相关专利信息
径向基函数神经网络
线性天线阵列
数据归一化方法
权重优化方法
特征值
充电调度策略
充电站
效用优化方法
构建传感器网络
无线可充电传感器网络技术
信息提取模型
生成系统
节点
线段
问答对生成方法
芯片模块
分布式计算任务调度
激光雷达
接入交换机
汇聚交换机