摘要
本发明公开了一种基于安卓系统部署的大语言模型快速推理方法和系统,包括:在PC端中构建OpenGL环境,并在OpenGL环境中克隆大语言模型推理框架,并在OpenGL环境中选择GPU硬件加速,将大语言模型推理框架和硬件加速编译转换后得到so文件;获取大语言模型资源文件,并将大语言模型资源文件转换量化为GGUF格式文件;利用安卓开发组件准备安卓NDK环境,并在安卓NDK环境中将大语言模型的GGUF格式文件转换为LLM.so文件,并在安卓NDK环境中配置动态库链接;创建安卓NDK项目,在安卓NDK项目中配置大语言模型推理的GPU调用指令,启动大语言模型推理,在对应PC端的CPU中运行。
技术关键词
大语言模型
安卓系统
推理方法
配置动态库
集成开发工具
项目创建方法
命令行工具
生成可执行
指令
框架方法
接口
处理器
推理系统
可读存储介质
转换方法
资源
安装工具
生成方法
系统为您推荐了相关专利信息
服务性能监控
大语言模型
数据
性能优化方法
端口
结构化查询语言
表达式
查询方法
数据字
大语言模型
深度语义分析
大语言模型
项目
语义向量
召回方法
场景理解方法
点云特征
编码模块
多模态
图像编码器