摘要
本申请公开了一种大语言模型的终端部署方法和装置、电子设备和存储介质,可广泛应用于模型处理技术领域。本申请通过将原始大语言模型转换为目标模型格式对应的目标大语言模型以及调用分词器模型,并编译不同平台对应的动态链接库后,通过动态链接库调用分词器模型,以及通过预设开放神经网络交换模型的运行状态调用目标大语言模型后,将分词器模型的输入作为目标大语言模型的输入进行预测,从而实现大语言的终端部署和应用,有效减少代码编写工作量,提高研发效率。
技术关键词
大语言模型
动态链接库
格式
平台
安装工具
终端
电子设备
可读存储介质
处理器
无监督
模块
文件夹
指令
计算机
程序
工作量
文本
存储器
系统为您推荐了相关专利信息
温度控制方法
链路
回归分析方法
参数
物联网传感器设备
正向运动学
雅可比矩阵
CORDIC算法
神经网络量化
平台