应用于智能对话大模型的推理加速优化方法及系统

正文

推荐专利

申请号：CN202511211400

申请日期：2025-08-28

公开号：CN120725158B

公开日期：2025-11-28

类型：发明专利

摘要

本发明提供应用于智能对话大模型的推理加速优化方法及系统，属于大模型技术领域，首先获取待推理对话序列及推理环境配置信息，其中待推理对话序列包含用户实时输入文本和历史交互语句链，推理环境配置信息涵盖运算节点负载状态和缓存资源占用信息，接着对两者进行联合流程解构处理，得到推理节点依赖图谱和资源弹性需求清单，再基于上述结果执行推理链路优化处理，生成推理加速执行方案，包含推理节点并行调度规则和资源预分配策略，依据该推理加速执行方案调控推理运算流程，生成加速处理后的对话响应序列，最后将加速处理后的对话响应序列推送至用户交互终端完成智能对话输出，从而有效提升智能对话大模型的推理速度，优化对话交互体验。

技术关键词

节点语义环境配置信息层级资源预留资源使用量序列图谱硬件处理单元标记交互终端动态缓存资源管理关系复杂度核心边界检测算法语句标识

系统为您推荐了相关专利信息

一种基于无人机数据采集和生成式对抗网络的路网交通流量估计方法

无人机数据采集生成式对抗网络数据估计方法多头注意力机制路段

一种电网电压动态调节与无功补偿系统

无功补偿系统 SVG设备电网拓扑结构路径特征节点

一种抗生素全生命周期在线监测管理方法及系统

抗生素监测管理方法聚类网络时序

基于大数据的社会信用指标库构建方法及系统

编码向量指标库校验编码大数据查询特征

一种电气设备分类规则自学习方法及相关系统

分类规则学习方法决策树算法决策树模型节点

应用于智能对话大模型的推理加速优化方法及系统

站点导航

APP 下载