一种基于RISC-V向量扩展的LLM推理加速方法及装置

AITNT
正文
推荐专利
一种基于RISC-V向量扩展的LLM推理加速方法及装置
申请号:CN202511031791
申请日期:2025-07-25
公开号:CN120930787A
公开日期:2025-11-11
类型:发明专利
摘要
本申请公开了一种基于RISC‑V向量扩展的LLM推理加速方法及装置,属于大语言模型设计领域。旨在解决大型语言模型LLM推理过程中的性能瓶颈问题,特别是在边缘计算设备上的部署。所述方法包括通过性能分析工具对推理过程进行分析,识别出瓶颈算子,并利用RISC‑V向量扩展RVV指令集对这些瓶颈算子进行重构,提升计算效率。重构后的算子能够实现并行化计算SIMD,并通过动态调整向量寄存器长度以最大化硬件资源的利用。该方法还基于RVV的动态向量长度适配机制,确保优化后的算子能够根据不同硬件平台自动适配,从而实现推理任务在多平台间的高效迁移与执行,有效提高了LLM推理的实时性和系统效率。
技术关键词
SIMD并行处理 瓶颈 性能分析工具 硬件平台 动态 阶段 指令 可读存储介质 大语言模型 加速装置 重构模块 框架 机制 分析模块 逻辑 计算机 复杂度
系统为您推荐了相关专利信息
1
一种儿童输液屏屏保轮播方法、装置、设备及介质
轮播方法 儿童 脱敏数据 内容推荐模型 时间段
2
基于混合层动态与氮磷限制耦合的湖泊生态修复方法
湖泊生态修复 混合层 水体营养盐 浅水型湖泊 动态
3
一种多平台环境感知与融合图谱构建方法及系统
图谱构建方法 融合感知信息 多模态环境 节点 多平台
4
一种基于丘脑-皮层耦合神经元群模型的疼痛客观量化方法及系统
客观量化方法 采集脑电信号 指数 指标 量化系统
5
一种智能化焊装夹具可视化检测方法
焊装夹具 图像增强模型 可视化检测方法 颜色校正 图像校正
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号