语言推理服务器、用于语言推理的方法、用于视觉语言大模型推理的系统、介质和产品

正文

推荐专利

申请号：CN202511140949

申请日期：2025-08-15

公开号：CN120725153B

公开日期：2025-10-31

类型：发明专利

摘要

本发明总体涉及基于特定计算模型的计算机系统，具体涉及语言推理服务器、用于语言推理的方法、用于视觉语言大模型推理的系统、介质和产品。一种语言推理服务器包括计算资源、大语言模型、缓存池和任务调度组件。任务调度组件响应于检测到大语言模型需要执行与第一词嵌入和语言要素相关联的语言推理的第一部分时，基于第一请求标识来检查缓存映射字典，基于检查的结果，选择性地从缓存池加载第一词嵌入，并选择性地指示大语言模型调用计算资源来执行语言推理任务的第一部分。其中，大语言模型执行该第一部分与视觉服务器执行视觉编码计算的至少部分地同时进行。一些实施例提高了系统吞吐量，并降低了系统时延。

技术关键词

推理服务器大语言模型任务调度采样率采样模块视觉字典标识图像图形处理单元位置编码信息教师系统系统吞吐量内存图文计算机程序产品计算机系统蒸馏

系统为您推荐了相关专利信息

面向大语言模型的知识图谱推荐算法

大语言模型推荐算法深度优先搜索算法节点时效性

基于大语言模型思维链的固件逻辑漏洞检测方法、系统、电子设备和计算机可读存储介质

大语言模型漏洞知识库逻辑漏洞检测方法固件

基于反向提示词的小说生成方法、装置、电子设备及介质

大语言模型生成关系对象生成方法电子设备

一种智能媒资管理与内容生产方法、系统、终端及存储介质

媒资管理多智能体协作索引标签数据

一种基于变长瑞利桥的动态散射介质成像方法及系统

散射介质成像方法注意力机制动态神经网络模型申请方法

语言推理服务器、用于语言推理的方法、用于视觉语言大模型推理的系统、介质和产品

站点导航

APP 下载