一种基于多级缓存机制的大模型部署方法及系统

AITNT
正文
推荐专利
一种基于多级缓存机制的大模型部署方法及系统
申请号:CN202510245377
申请日期:2025-03-04
公开号:CN119739809B
公开日期:2025-07-08
类型:发明专利
摘要
本申请提供一种基于多级缓存机制的大模型部署方法及系统,其中,建立第一级动态语义缓存,在新请求匹配时优先反馈重构的答案,对于未命中请求,则启动第二级上下文关联缓存,通过提取隐式语义轨迹向量和构建动态关联图谱识别潜在上下文依赖关系,实现渐进式答案拼接,若仍未能覆盖,则激活第三级意图决策缓存,利用多层级解析结构进行场景归类、状态标记,基于知识拓扑网络生成查询指令并抽取多模态响应元素以生成组合式应答,系统同步执行多级缓存协同优化,根据用户反馈调整缓存策略,并自适应地扩容与淘汰缓存数据,本申请实施例提供的技术方案显著提升了大模型部署的响应速度、上下文理解能力和个性化服务水平。
技术关键词
语义 多级缓存机制 模型部署方法 拓扑网络 多模态响应 图谱 时空分布特征 分区策略 会话 节点 滑动窗口机制 动态权重分配 答案 逻辑 层级 组合式 标识符 热点数据识别 缓存策略
系统为您推荐了相关专利信息
1
一种基于问答数据的大模型溯源方法及系统
动态触发器 溯源方法 问答对数据 答案 语义
2
一种基于特征融合与动态变换器的深度哈希图像检索方法
变换器 动态 大规模图像检索 语义 非线性
3
向量化知识表示与大型模型匹配的知识库系统
字符 知识库系统 条目 语义 位置编码单元
4
一种面向卫星网络的语义通信方法、装置及电子设备
面向卫星网络 信道解码模块 语音特征信息 样本 语义特征
5
一种基于知识星图增强大语言模型的化工安全运维方法、设备、介质及产品
实体 大语言模型 运维方法 关键词 化工
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号