应用于智能对话大模型的推理加速优化方法及系统

AITNT
正文
推荐专利
应用于智能对话大模型的推理加速优化方法及系统
申请号:CN202511211400
申请日期:2025-08-28
公开号:CN120725158B
公开日期:2025-11-28
类型:发明专利
摘要
本发明提供应用于智能对话大模型的推理加速优化方法及系统,属于大模型技术领域,首先获取待推理对话序列及推理环境配置信息,其中待推理对话序列包含用户实时输入文本和历史交互语句链,推理环境配置信息涵盖运算节点负载状态和缓存资源占用信息,接着对两者进行联合流程解构处理,得到推理节点依赖图谱和资源弹性需求清单,再基于上述结果执行推理链路优化处理,生成推理加速执行方案,包含推理节点并行调度规则和资源预分配策略,依据该推理加速执行方案调控推理运算流程,生成加速处理后的对话响应序列,最后将加速处理后的对话响应序列推送至用户交互终端完成智能对话输出,从而有效提升智能对话大模型的推理速度,优化对话交互体验。
技术关键词
节点 语义 环境配置信息 层级 资源预留 资源使用量 序列 图谱 硬件处理单元 标记 交互终端 动态 缓存资源管理 关系 复杂度 核心 边界检测算法 语句 标识
系统为您推荐了相关专利信息
1
一种基于无人机数据采集和生成式对抗网络的路网交通流量估计方法
无人机数据采集 生成式对抗网络 数据估计方法 多头注意力机制 路段
2
一种电网电压动态调节与无功补偿系统
无功补偿系统 SVG设备 电网拓扑结构 路径特征 节点
3
一种抗生素全生命周期在线监测管理方法及系统
抗生素 监测管理方法 聚类 网络 时序
4
基于大数据的社会信用指标库构建方法及系统
编码向量 指标库 校验编码 大数据 查询特征
5
一种电气设备分类规则自学习方法及相关系统
分类规则 学习方法 决策树算法 决策树模型 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号