推理系统、推理方法、推理装置、存储介质及程序产品

AITNT
正文
推荐专利
推理系统、推理方法、推理装置、存储介质及程序产品
申请号:CN202411604667
申请日期:2024-11-12
公开号:CN119129755B
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了推理系统、推理方法、推理装置、存储介质及程序产品,该推理系统包括:大语言模型参数仓库,用于提供各种大语言模型对应的共享参数和微调参数的下载服务,共享参数和微调参数是基于LoRA大语言模型微调范式将对应大语言模型中的参数拆分为供多用户共享的预训练参数和针对用户需求对共享参数进行微调的参数;多个资源池,资源池包括多个推理节点,推理节点加载有共享参数和微调参数时作为执行节点;控制节点,用于从多个资源池中调度一个能执行推理请求对应推理任务的执行节点作为实际执行节点,将推理任务发送给实际执行节点,使实际执行节点根据推理任务中携带的输入数据实例化为大语言模型来执行推理任务。
技术关键词
大语言模型 节点 推理系统 参数 应用程序编程接口 资源 推理装置 推理方法 多用户 仓库 存储器 处理器 可读存储介质 标识 服务组件 计算机程序产品 指令 数据 误差
系统为您推荐了相关专利信息
1
基于随机森林模型的内存故障维护系统及方法、电子设备、存储介质、计算机程序产品
随机森林模型 内存 动态可视化 数据采集模块 可视化参数
2
基于大语言模型的异质信息网络元路径挖掘方法及系统
异质信息网络 大语言模型 样例三元组 路径挖掘方法 挖掘系统
3
基于地质体几何拓扑约束的多场耦合地质模型建立方法及系统
多面体 地质模型建立方法 节点 点云 三维地质模型
4
一种资源使用情况预测方法及装置
指标 资源 时间段 权重机制 长短期记忆网络
5
基于多组学数据的抑郁症运动干预效果评估方法及系统
运动处方 数据 机器学习算法 生物标志物 集成学习模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号