一种基于大语言模型的推理方法、装置、及电子设备

AITNT
正文
推荐专利
一种基于大语言模型的推理方法、装置、及电子设备
申请号:CN202510700087
申请日期:2025-05-28
公开号:CN120671811A
公开日期:2025-09-19
类型:发明专利
摘要
本发明实施例公开一种基于大语言模型的推理方法、装置及电子设备,涉及计算机技术领域,能够加快目标序列的形成,提高大语言模型的推理速度。所述方法包括:基于初始输入序列,草稿模型并行生成N个序列的头部词元,其中N为大于2的正整数;将每一个序列的头部词元,分别作为检索词,遍历高频词典树,以在所述高频词典树中检索以所述头部词元为首节点的子序列;将检索到的所述子序列,与对应的头部词元相组合形成以对应头部词元为头部的猜测序列,得到N个猜测序列;使用目标模型对所述N个猜测序列进行验证,从所述N个猜测序列中确定目标序列。本发明适用于基于大语言模型的推理中。
技术关键词
序列 推理方法 词典 大语言模型 计算机可读指令 电子设备 节点 推理装置 可读存储介质 列表 分词 处理器 速度
系统为您推荐了相关专利信息
1
一种光伏场景智能生成方法及系统
智能生成方法 多头注意力机制 频率 多尺度 统计特征
2
一种异构多模态混合专家适配器
嵌入特征 注意力 模态特征 适配器 多模态
3
基于改进YOLOv8n算法的城市空间混行交通参与者检测模型
位置感知信息 阶段 智能交通检测技术 序列切片 注意力机制
4
一种场景表面重建方法、装置、设备及介质
表面重建方法 图像 多视角 场景 三维重建算法
5
模型训练方法及客流量的预测方法
神经网络模型 模型训练方法 编码器参数 非易失性存储介质 注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号