基于异构推理的模型推理加速方法、装置、设备及介质

AITNT
正文
推荐专利
基于异构推理的模型推理加速方法、装置、设备及介质
申请号:CN202510310399
申请日期:2025-03-17
公开号:CN120197700A
公开日期:2025-06-24
类型:发明专利
摘要
本申请公开了一种基于异构推理的模型推理加速方法、装置、设备及介质,涉及人工智能技术领域,包括:将提示词输入至位于中央处理器的目标推理模型;将得到的第一令牌生成信息以及目标令牌序列输入至位于图形处理器的目标草稿模型,以便生成待确定草稿令牌生成树并进行迭代更新;基于得到的目标草稿令牌生成树生成目标草稿令牌集,并将生成树信息以及目标草稿令牌集输入至目标推理模型;基于得到的目标验证概率值对目标草稿令牌集进行验证,以确定下一轮的目标令牌序列以及第一令牌生成信息,然后跳转至输入至位于图形处理器的目标草稿模型的步骤,直至满足预设停止条件。由此,可以进一步的提高模型的推理速度以满足高效推理的需求。
技术关键词
令牌 生成树 图形处理器 序列 异构 中央处理器 输入模块 变量 键值 参数 索引 人工智能技术 加速装置 可读存储介质 电子设备 数据 精度 存储器
系统为您推荐了相关专利信息
1
一种服装款式数字化识别方法及系统
数字化识别方法 动态视频序列 款式分类 指纹 电数字数据处理技术
2
基于分块交错流水线的模型更新方法、装置、设备及产品
模型更新方法 分块 中央处理器 图形处理器 流水线
3
用于大语言模型的自然语言智能交互方法
智能交互方法 大语言模型 智能客服 自然语言 序列
4
基于紧致表征建模和语义标签引导的细粒度图像检索方法
特征提取网络 语义标签引导 编码 注意力 样本
5
一种基于工作量证明的人机交互检测方法与系统
人机交互检测 工作量证明 网站访问量 客户端 访问受保护
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号