模型首字推理方法及装置

AITNT
正文
推荐专利
模型首字推理方法及装置
申请号:CN202411083004
申请日期:2024-08-07
公开号:CN118863065A
公开日期:2024-10-29
类型:发明专利
摘要
本发明提供一种模型首字推理方法及装置,所述方法包括:获取模型的计算图,并从计算图中确定模型的末个注意力模块所在的计算子图;在计算子图中添加剪切节点,基于添加剪切节点后的计算子图,应用输入文本,进行模型首字推理,得到首字推理结果;剪切节点位于上一计算子图的输出节点之后,剪切节点用于在每个批次的行维度上对上一节点的输出进行剪切操作。本发明将剪切节点设置于上一计算子图的输出节点之后,从而剪切节点能够在每个批次的行维度上对上一节点的输出进行剪切操作,不仅能够去除冗余计算,提高首字推理效率,且去除冗余计算后也不会影响首字推理结果的计算精度。
技术关键词
推理方法 节点 注意力 图形处理器 非暂态计算机可读存储介质 文本 推理装置 计算机程序产品 模块 中央处理器 冗余 存储器 阶段 电子设备 解码
系统为您推荐了相关专利信息
1
一种传播源定位方法及装置
传播源定位方法 融合特征 节点 去噪模型 快照
2
一种基于语义一致性的开放词汇视听分割方法
音频特征 视觉特征 语义 跨模态 视听
3
基于深度学习的智能食物识别与营养分析方法
营养分析方法 智能食物 深度卷积神经网络预测 深度图 生成场景
4
基于分组的蛋白质序列聚类方法及系统
序列聚类方法 通用哈希函数 滑动窗口 队列 节点
5
一种便携式救援通信终端的控制系统
通信网络节点 通信网络故障分析 救援场景 通信终端 多路径效应
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号