一种结合机器学习和投机采样的大模型推理加速方法及系统

AITNT
正文
推荐专利
一种结合机器学习和投机采样的大模型推理加速方法及系统
申请号:CN202411110911
申请日期:2024-08-14
公开号:CN118657220B
公开日期:2024-10-29
类型:发明专利
摘要
本发明公开了一种结合机器学习和投机采样的大模型推理加速方法及系统,其中方法包括:根据检索出的本地知识构建n‑gram语言模型;n‑gram语言模型推理阶段根据给定文字token,预测下一个token在词表中的概率分布,并采样预测下一个token;基于构建的n‑gram模型和大模型,实现投机采样算法,加速大模型推理。与当前的主流方法相比,本发明生成的内容相比较于现有投机采样算法所使用的近似小模型,更加可靠,其计算量少且减少了内存访问的需求,速度更快。本发明还进一步分别将改进的投机采样算法应用于transformers库和推理框架vLLM,推理速度获得进一步提升。
技术关键词
加速系统 算法 存储器 处理器 尺寸 框架 内存 速度 文本 数据 序列 阶段 模式 参数
系统为您推荐了相关专利信息
1
一种岩心图像去噪方法、装置及设备
岩心图像 去噪模型 采样器 样本 图像去噪方法
2
矫正策略生成方法、装置、计算机设备及存储介质
矫正模型 隐形矫正器 形态 策略生成方法 点云
3
一种基于4D毫米波雷达和激光雷达的直升机避障方法
激光雷达 避障方法 直升机 DBSCAN聚类算法 时间偏移估计
4
一种多输入中文拼写纠错方法、系统、电子设备及介质
大语言模型 拼写纠错方法 输入中文 模板 生成提示词
5
一种信道数据的生成方法、装置、电子设备及存储介质
终端天线 多径参数 信道 采集设备 列表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号