语言推理服务器、用于语言推理的方法、用于视觉语言大模型推理的系统、介质和产品

AITNT
正文
推荐专利
语言推理服务器、用于语言推理的方法、用于视觉语言大模型推理的系统、介质和产品
申请号:CN202511140949
申请日期:2025-08-15
公开号:CN120725153B
公开日期:2025-10-31
类型:发明专利
摘要
本发明总体涉及基于特定计算模型的计算机系统,具体涉及语言推理服务器、用于语言推理的方法、用于视觉语言大模型推理的系统、介质和产品。一种语言推理服务器包括计算资源、大语言模型、缓存池和任务调度组件。任务调度组件响应于检测到大语言模型需要执行与第一词嵌入和语言要素相关联的语言推理的第一部分时,基于第一请求标识来检查缓存映射字典,基于检查的结果,选择性地从缓存池加载第一词嵌入,并选择性地指示大语言模型调用计算资源来执行语言推理任务的第一部分。其中,大语言模型执行该第一部分与视觉服务器执行视觉编码计算的至少部分地同时进行。一些实施例提高了系统吞吐量,并降低了系统时延。
技术关键词
推理服务器 大语言模型 任务调度 采样率 采样模块 视觉 字典 标识 图像 图形处理单元 位置编码信息 教师系统 系统吞吐量 内存 图文 计算机程序产品 计算机系统 蒸馏
系统为您推荐了相关专利信息
1
面向大语言模型的知识图谱推荐算法
大语言模型 推荐算法 深度优先搜索算法 节点 时效性
2
基于大语言模型思维链的固件逻辑漏洞检测方法、系统、电子设备和计算机可读存储介质
大语言模型 漏洞知识库 逻辑 漏洞检测方法 固件
3
基于反向提示词的小说生成方法、装置、电子设备及介质
大语言模型 生成关系 对象 生成方法 电子设备
4
一种智能媒资管理与内容生产方法、系统、终端及存储介质
媒资管理 多智能体协作 索引 标签 数据
5
一种基于变长瑞利桥的动态散射介质成像方法及系统
散射介质成像方法 注意力机制 动态 神经网络模型 申请方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号