一种基于安卓系统部署的大语言模型快速推理方法和系统

AITNT
正文
推荐专利
一种基于安卓系统部署的大语言模型快速推理方法和系统
申请号:CN202511323632
申请日期:2025-09-17
公开号:CN120821515B
公开日期:2025-12-26
类型:发明专利
摘要
本发明公开了一种基于安卓系统部署的大语言模型快速推理方法和系统,包括:在PC端中构建OpenGL环境,并在OpenGL环境中克隆大语言模型推理框架,并在OpenGL环境中选择GPU硬件加速,将大语言模型推理框架和硬件加速编译转换后得到so文件;获取大语言模型资源文件,并将大语言模型资源文件转换量化为GGUF格式文件;利用安卓开发组件准备安卓NDK环境,并在安卓NDK环境中将大语言模型的GGUF格式文件转换为LLM.so文件,并在安卓NDK环境中配置动态库链接;创建安卓NDK项目,在安卓NDK项目中配置大语言模型推理的GPU调用指令,启动大语言模型推理,在对应PC端的CPU中运行。
技术关键词
大语言模型 安卓系统 推理方法 配置动态库 集成开发工具 项目创建方法 命令行工具 生成可执行 指令 框架方法 接口 处理器 推理系统 可读存储介质 转换方法 资源 安装工具 生成方法
系统为您推荐了相关专利信息
1
基于思维链提示的多跨度问答认知匹配方法及系统
答案 跨度 大语言模型 线索 语义结构
2
基于大模型的服务性能优化方法及装置、电子设备和介质
服务性能监控 大语言模型 数据 性能优化方法 端口
3
数据字段的口径查询方法、装置、介质、设备及程序产品
结构化查询语言 表达式 查询方法 数据字 大语言模型
4
一种大屏内容召回方法、装置、存储介质和程序产品
深度语义分析 大语言模型 项目 语义向量 召回方法
5
一种基于多模态大模型的三维场景理解方法
场景理解方法 点云特征 编码模块 多模态 图像编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号